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La pr£sente invention conceme un proc6d6 pour le pronostic du neuroblastome. 



Le neuroblastome est en frequence la deuxieme cause de tumeur solide chez Tenfant 
apr£s les tumeurs c6rebrales. Le neuroblastome est le plus frequent des cancers de 
Tenfant avant cinq ans et reprSsente environ 15 % des cancers avant cet age. 

Les neuroblastomes sont des tumeurs malignes'developpees a partir de neuroblastes 
nes de la crSte neurale et migrant pour former les ganglions sympathiques et la 
m6dullo-surrenale durant la p&riode embryonnaire et foetale. 

Lorsqu'un premier examen clinique permet de suspecter un neuroblastome (boule, 
hematome, endroit douloureux, difficulty a bouger les membres, etc. . un bilan 
complet est realise afin de confirmer le diagnostic. 
Generalement, ce bilan comprend : 

> des examens par prelevements (san^Tiiines), 

> differents examens radiologiques qui ont pour but de bien situer la tumeur, 
ses limites et sa taille (scintigraphies echographie et/ou scanner et/ou IRM ), 

> des examens au microscope de fragments de tumeurs afin de decouvrir 
exactement de quel type de tumeur dont il s'agit. 

A Pheure actuelle, il n'existe pas de traitement universel lorsqu'un neuroblastome est 
diagnostique, et un traitement specifique doit etre adapte en fonction de Page du 
patient. On distingue alors principalement les traitements loco-r6gionaux (chirurgie 
et radiotherapie) afin d'enlever ou detruire la tumeur directement a 1' endroit ou elle 
se trouve et les traitements generaux (chimiotherapie), qui agissent dans tout 
Porganisme du patient a la fois sur la tumeur et mais aussi la ou peuvent se trouver 
les metastases. 

Le traitement du patient peut etre adapte selon le pronostic du neuroblastome et la 
strat6gie therapeutique peut s'averer tres differente selon le stade et la caract6risation 
g6n6tique des cellules tumorales. Ainsi, dans les formes localisees dont les cellules 
tumorales ne portent aucun caractere de mauvais pronostic, le traitement est 
essentiellement chirurgical alors que dans les formes localisees dont les cellules 
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tumorales sont de mauvais pronostic, le traitement doit etre plus agressif, reposant 
sur la chimiotherapie et une radiotherapie locale. 

II existe a l'heure actuelle differentes classifications du neuroblastorne permettant de 
definir de la fa?on la plus precise possible des groupes pronostiques. Ces groupes 
permettent theoriquement de definir les indications thSrapeutiques de fa?on adaptee 
au risque de la maladie. On pent citer notamment la classification de l'lnternational 
Neuroblastoma Staging System (Brodeur et al. (1993) J. Clin. Oncol. 11, 1466-77), 
qui tient compte des donnees anatomiques actuellement reconnues comme ayant une 
valeur pronostique. Selon cette classification, on distingue les stades suivants : 

> stade 1 : tumeur localisee totalement enlev6e macroscopiquement ; ganglions 
homo et controlateraux examines et negatifs microscopiquement 

> stade 2A : tumeur unilaterale enlev6e incompletement avec des ganglions 
hom o et controlateraux examines et negatifs. 

> stade 2B : tumeur unilaterale avec atteinte ganglionnaire homolaterale et hon 
controlat6rale. 

> stade 3 : tumeur unilaterale non operable montrant un depassement de la ligne ' 
mediane ou tumeur unilaterale avec atteinte ganglionnaire controlaterable bu 
tumeur a cheval sur la ligne mediane avec extension bilaterale par infiltration' 
ou par adenopathie. 

> stade 4 : tumeur primitive s ? accompagnant d ! une dissemination a distance : 
ganglionnaire, osseuse, mSdullaire, hepatique. 

> stade 4S : tumeur de stade local 1 ou 2 avec une dissemination limitee au 
foie, a la peau ou a la moelle osseuse. Les stades 4S sont des enfants ayant un 
age inferieur a 1 an. 

Actuellement, le pronostic d'un neuroblatome peut etre etabli par Tetude de 
differents facteurs: 

i) Tamplification de Toncogene N-myc est consideree comme un outil de 
reference, et est utilisee par la plupart des oncologues pediatriques pour 
definir, au moment du diagnostic, les malades qui doivent recevoir une 
chimioth&rapie intensive suivie de greffe de moelle (Seeger et al, N Engl J 
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Med. 1985 ; 313(18):llll-6 ; Rubie et al J Clin Oncol. 1997 Mar;15(3):l 171- 
82.). 

2) il existerait egalement une correlation entre le pronostic du neuroblastome et 
le rapport des catecholamines VMA (vanilmandelic acid) / HVA 
(homovanillic acid), au moment du diagnostic. Dans les stades avancSs, une 
excretion-urinaire elevee d'HVA et basse de VMA, voire normal^ signerait 
un mauvais pronostic (Laug et al Pediatrics. 1978 ; 62(l):77-83). 

3) ^augmentation de la ferritine serique dans les neuroblastomes est egalement 
consideree comme un facteur de mauvais pronostic (Evans et al, Cancer. 
1987; 59(1 1):1 853-9). 

4) le taux de LDH (lactate deshydrogenase) pourrait 6galement etre un facteur de 
pronostic independant et predominant pour les stades localises I h HI chez 
l f en fant de pl us d'un an, et de fa?on moins importante chez l'enfant d e moins 
d'un an jivec un stade IV (Berfhold et al, Am J Pediatr Hematol Oncol. 1994 ; 
16(2):107-15). 

Toutefois, la correlation entre ^amplification de Toncogene N-myc et le pronostic du 
neuroblastome n'est pas absolue (Maris & Matthay, J Clin Oncol, 1999, 17(7) : 
2264-2279). De plus la LDH et la ferritine 6tant deux facteurs correles entre eux, la 
fiabilite de ces facteurs pour le pronostic du neuroblastome reste discutee (Berthold 
et al, 1992, Am J Pediatr Hamtol Oncol, 14(3) : 207-215). Enfin, l'utilisation du 
rapport VMA/HVA donne une sensibilite et une specificite insuffisantes pour le 
pronostic du neuroblastome. 

La presente invention se propose de resoudre Pensemble des inconv&iients de 
Petat de la technique en presentant un nouvel outil de pronostic du neuroblastome. 

D'une maniere surprenante, les inventeurs ont mis en Evidence que le 
pronostic d'un neuroblastome peut etre determine par l'analyse de P expression de 
genes cibles s61ectionn6s parmi 37 genes tel que presente dans le tableau 1 ci apres, 
qui sont exprim6s diff6rentiellement selon que le patient soit de bon ou de mauvais 
pronostic. 
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Tableau 1 - liste des 37 genes cibles selon rinvention 



SEQ ID 

N° 


Description de la sequence 


N° Genbank 


1 


Flap structure-specific endonuclease 1 (FEN1) 


NM 004111 


2 




NM 007019 


3 


Insulin-like growth factor binding protein 7 (IGFBP7) 


NM 001553 


4 


Collagen, type I, alpha 2 (COL1 A2) 


NM 000089 


5 


Nucleolin (NCL) 


NM 005381 


6 ! 


Interleukin enhancer binding factor 3, 90kDa (ILF3), transcript variant 2 


NM 004516 


7 


cDNA FLJ30781 fis, clone FEBRA2000874 


AK055343 


8 


TIF 1 beta zinc finger protein 


X97548 


9 


Likely ortholog of mouse tumor differentially expressed 1 , like (TDE1L) 


NM 020755 


10 


DKFZp434Dl 1 12_sl 434 (synonym: htes3) cDNA clone DKFZp434Dl 112 3' 


AL039831 ! 


1 1 


v-myc myelocytomatosis viral related oncogene, neuroblastoma derived 
(avianj(MYCN) 


NM 005378 


12 


oinciJi iiuvicoi riuuiiLioicupivJicjii u~ puiypcpiiut? iu>ju/a ^oi^iivri-'A^, uauouipi 

variant 1 


NM 004597 


13 


MCM2 minichromosome maintenance deficient 2, mitotin (S. cerevisiae) 


NM 004526 


14 


RuvB-like 2 (E. coli) (RUVBL2) 


NM 006666 


15 


Immediate early protein ETUI 01 


NM 004907 - 


16 


RNA binding protein SI, serine-rich domain (RNPS 1), transcript variant 1 


NM* 00671 1 


17 


Ornithine decarboxylase 1 (ODC1) 


NM 002539 


18 


Activity-regulated cytoskeleton-associated protein (ARC) 


NM 015193 - 


19 


Secretogranin II (chromogranin C) (SCG2) 


NM 003469 ... 


20 


Structure specific recognition protein 1 (SSRP1) 


NM 003146 


21 


Collagen, type v l 9 alpna d {k^kjLoA^), transcript variant i 


NM V 004369 


22 


Small nuclear ribonucleoprotein polypeptides B and Bl (SNRPB) 


NM 003091 


23 


Acidic ^leucine-ncn) nuclear pnospnoprotein j/ iamiiy, memoer d ^/vini oao) 


NM 006401 


24 


iNon-rUu uomam containing, octamer-Dinuing ^iNijrNVjj 


NM 007363 


25 


r enpnerai myelin proiein ^riyir^z^, tntnscnpt vanani l 


NM 000304 


26 


on] all nuuicai iiounuoicupnjtcin. puiypcptiuc c ^ontvi 


NM 003094 


27 


WT A AClA'XA tnRMA rvor+ial r»rlc 

JVl/\/\Uf JO mixiN/V, partial CUS 


ABO 07896 


28 


i I Ul 1 1 J<U ill ^1 1— > 1 — ' y 


NM 00143O . 


29 


Tripartite motif-containing 2 (TRIM2) 


NM 015271 


30 


MCM6 minichromosome maintenance deficient 6 (MIS5 homolog, S. pombe) 
(S. cerevisiae) (MCM6) 


NM 005915 


31 


Polypyrimidine tract binding protein 1 (PTBP1), transcript variant I 


NM 002819 


32 


Small nuclear ribonucleoprotein polypeptide A (SNRP A) 


NM 004596 


33 


Creatine kinase, brain (CKB) 


NM 001823 


34 


Erythrocyte membrane protein band 4.1 -like 3 (EPB41L3) 


NM 012307 


35 


Hypothetical protein MGC3077 


NM 024051 


36 


Tissue alpha-L-fucosidase 1 (FUCA 1) 


NM 000147 


37 


Secreted protein acidic and rich in cysteine (SPARC) 


NM 003118 



i uepoi 
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Parmi ces g&ies, on peut distinguer des genes dont la fonction est connue mais qui 
n'ont jamais ete mis en relation avec le neuroblastome ( SEQ ID N°l a 8 ; 12 a 16 ; 
18 a 26 ; 28 ; 30 h 34 ; 36) ainsi que des g&nes dont la fonction est inconnue (SEQ ID 
N°9 ; 10 ; 27 ; 29 ; 35). II est bien entendu que si differentes isoformes de ces genes 
5 existent, toutes les isoformes sont relevantes pour la presente invention, et pas 
uniquement celles presentees dans le precedent tableau. - . . - 

A cet effet, la presente invention conceme un proc6d£ pour le pronostic du 
neuroblastome chez un patient atteint du neuroblastome caracterise en ce qu'il 
10 comprend les etapes suivantes : 

eu on extrait du materiel biologique d'un echantillon biologique preleve 
chez le patient, 

b. on me t en con tact le materiel biologique avec au moins un react if 
sp6cifique choisi parmi les reactifs specifiques des genes cibles 
15 pr^sentant une sequence nucleique ayant Tune quelconque des SEQ ID 

N° 1 a 37, etant entendu que lorsque que le gene cible presente une 
sequence nucleique ayant Tune des SEQ ID N°ll, 17 ou 37, on met en 
contact le materiel biologique avec au moins deux reactifs specifiques 
choisis parmi les reactifs specifiques des genes cibles presentant une 
20 sequence nucleique ayant l'xine quelconque des SEQ ED N° 1 a 37, 

a on determine ^expression d'au moins un desdits g£nes cibles, etant 
entendu que lorsque que le gene cible presente une sequence nucleique 
ayant Tune des SEQ ID N°l 1, 17 ou 37, on determine Pexpression d'au 
moins deux desdit g£nes cibles 
25 Au sens de la presente invention, on entend par echantillon biologique. tout 
Echantillon preleve chez un patient, et susceptible de contenir un materiel biologique 
tel que defini ci apres. Cet echantillon biologique peut etre notamment un echantillon 
de sang, de serum, de saiive, tissu, de tumeur, de moelle osseuse, de cellules 
circulantes du patient. On dispose de cet echantillon biologique par tout type de 
30 preidvement connu de Phomme du metier. Selon un mode pr6f6r6 de realisation de 
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Finvention, l'echantillon biologique pr61eve chez le patient est un echantillon 
tissulaire, preferentiellement un Echantillon de tumeur ou de moelle osseuse. 
Au sens de la presente invention, on entend par materiel biologique , tout materiel 
permettant de detecter l'expression d'un gene cible. Le materiel biologique peut 
comprendre notamment des prot&nes, ou des acides nucl&ques tels que notamment 
les acides desoxyribonucleiques (ADN) ou les acides ribonucleiques (ARN). L'acide 
nucl&que peut etre notamment un ARN (acide ribonucleique). Selon un mode 
preffcre de realisation de l'invention, le materiel biologique comprend des acides 
nucl&ques, pr6ferentiellement, des ARN, et encore plus preferentiellement des ARN 
totaux. Les ARN totaux comprerment les ARN de transfert, les ARN messagers 
(ARNm), tel que les ARNm transcrit du gene cible, mais egalement transmit de tout 
autre gene et les ARN ribosomaux. Ce materiel biologique comprend du materiel 
snecifiaue d'un gene cible , tel que notamm ent les AR Nm transcrits du gene cible. ou 
les prot&nes issues de ces ARNm mais peut comprendre egalement du materiel non 
specifique d'un gene cible, tel que notamment les ARNm transcrits d'un gene autre 
que le g&ie cible, les ARNt, les ARNr issus d'autres genes que le gene cible. 
Lors de l'etape a) du procedS selon l'invention, on extrait le m ateriel biologique de 
l'6chantillon biologique par tous les protocoles detraction et de purification: 
d' acides nucleiques bien connus de l'homme du metier. 
A titre indicatif, 1'extraction d' acides nucleique peut etre realisee par : 

• une etape de lyse des cellules presentes dans l'echantillon biologique, afin de 
liberer les acides nucleiques contenus dans les cellules du patient. A titre 
d'exemple, on peut utiliser les methodes de lyse telles que decrites dans les 
demandes de brevet: 

o WO 00/0533 8 sur la lyse mixte magnetique et mecanique, 
o WO 99/53304 sur la lyse electrique, 
o WO 99/1 5321 sur la lyse mecanique. 
Uhomme du metier pourra utiliser d ! autres methodes de lyse bien connues, 
telles que les chocs thermiques ou osmotiques ou les lyses chimiques par des 
agents chaotropiques tels que les sels de guanidium (US 5,234,809). 
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une etape de purification, permettant la separation entre les acides nucl&ques 
et les autres constituants cellulaires relargues dans Petape de lyse. Cette etape 
permet generalement de concentrer les acides nucleiques, et peut etre adapte a 
la purification d'ADN ou d'ARN. A titre d'exemple, on peut utiliser des 
particules magnetiques eventuellement revetues d'oligonucleotides, par 
adsorption ou covalence (voir a ce sujet les brevets US 4,672,040 et US 
5,750,338), et ainsi purifier les acides nucl&ques qui se sont fix6s sur ces 
particules magnetiques, par une 6tape de lavage. Cette etape de purification 
des acides nucleiques est particulierement interessante si Ton souhaite 
amplifier ulterieurement lesdits acides nucleiques. Un mode de realisation 
particulierement interessant de ces particules magnetiques est decrit dans les 
demandes de brevet: WO-A-97/45202 et WO-A-99/35500. Un autre exemple 
interessant de methode de purificatio n des acid es nucleiques est Tutilisation 
de silice soit sous forme de colonne, soit sous forme de particules inertes 
(Boom R. et al., J. Clin. Microbiol., 1990, n°28(3), p. 495-503) ou 
magnetiques (Merck: MagPrep® Silica, Promega: MagneSil™ Paramagnetic 
particles). D'autres methodes tres repandues reposent sur des resines 
echangeuses d f ions en colonne ou en format particulate paramagnetique 
(Whatman: DEAE-Magarose) (Levison PR et al., J. Chromatography, 1998, 
p. 337-344). Une autre m&hode tres pertinente mais non exclusive pour 
1'invention est celle de Fadsorption sur support d'oxyde metallique (societe 
Xtrana: matrice Xtra-Bind™). 

Lorsque Ton souhaite extraire specifiquement l'ADN d'un echantillon 
biologique, on peut notamment realiser une extraction par du ph6nol, du 
chloroforme et de Talcool pour eliminer les prolines et precipiter FADN 
avec de 1'ethanol 100%. L'ADN peut alors etre culote par centrifugation, lave 
et remis en solution . 

Lorsque Ton souhaite extraire specifiquement les ARN d'un echantillon 
biologique, on peut notamment realiser une extraction par du phenol, du 
chloroforme et de l'alcool pour eliminer les proteines et precipiter les ARN 
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avec de l'ethanol 100%. Les ARN peuvent alors 6tre culote par 
centrifugation, lave et remis en solution. 

An sens de la presente invention, on entend par reactif sp6rifique, un reactif qui, 
lorsqu'il est mis en contact du materiel biologique tel que defini precedemment, se 
lie avec-le materiel specifique dudit gene cible. A titre indicate lorsque le reactif 
specifique et le materiel biologique sont d'origine nucleique, la mise en contact du 
reactif specifique et du materiel biologique permet l'hybridation du reactif specifique 
avec le materiel specifique du gene cible. Par hybridation, on entend le processus au 
cours duquel, dans des conditions appropriees, deux fragments nucleotidiques se lient 
avec des liaisons hydrogenes stables et specifiques pour former un complexe double 
brin. Ces liaisons hydrogenes se foment entre les bases complementaires Adenine 
(A ) et thymin e (T) (ou uracile (U)) (on parle de liaison A-T) ou entre les bases 
comptontaires Guanine (G) et cytosine (C) (on parle_ de liaison G-C) ; : 
L'hybridation de deux fragments nucleotidiques pent etre totale (on parle alors de ; 
fragments nucleotidiques ou de sequences complementaires), c'est a dire que le ' 
complexe double brin obtenu lors de cette hybridation comprend uniquement des. 
liaisons A-T et des liaisons C-G. Cette hybridation peut 6tre partielle (on parle alors 
de fragments nucleotidiques ou de sequences suffisamment complementaires), c'est a 
dire que le complexe double brin obtenu comprend des liaisons A-T et des liaisons 
C-G permettant de former le complexe double brin, mais egalement des bases non 
liees a une base complementaire. L'hybridation entre deux fragments nucleotidiques 
depend des conditions operatoires qui sont utilisees, et notamment de la stringency 
La stringence est definie notamment en fonction de la composition en bases des deux 
fragments nucleotidiques, ainsi que par le degre de mesappariement entre deux 
fragments nucl6otidiques. La stringence peut egalement etre fonction des parametres 
de la reaction, tels que la concentration et le type d'especes ioniques pr6sentes dans la 
solution dliybridation, la nature et la concentration d'agents denaturants et/ou la 
temperature d'hybridation. Toutes ces donndes sont bien connues et les conditions 
appropriees peuvent etre determines par lliomme du metier. En general, selon la 
longueur des fragments nucleotidiques que l'on souhaite hybrider, la temperature 



d*hybridation est comprise entre environ 20 et 70°C, en particulier entre 35 et 65°C 
da ns une sol ution saline a une concentration d'envirdn 0,5 a 1 M. Une sequence, ou 
fragment nucleotidique, ou oligonucleotide, ou polynucleotide, est un enchainement 
de motifs nucleotidiques assembles entre eux par des liaisons ester phosphorique, 
caracterise par la sequence informationnelle des acides nucleiques naturels, 
susceptibles de sliybrider a un fragment nucleotidique, l'enehainement pouvant 
contenir des monomSres de structures differentes et Stre obtenu a partir d'une 
molecule d'acide nucleique naturelle et/ou par recombinaison genetique et/ou par 
synthese chimique. Un motif est derive d'un monomere qui pent etre un nucleotide 
naturel d'acide nucleique dont les elements constitutifs sont un sucre, un groupement 
phosphate et une base azotee ; dans l'ADN le sucre est le desoxy-2-ribose, dans 
TARN le sucre est le ribose ; selon qu'il s'agisse de l'ADN ou l'ARN, la base azotee 
est choisie jjarmi l'adenine, la guanine, 1-uracile, la cytos ine, la thy mine ; ou bien le 
monomere est un nucleotide modifie dans l«un au moinsT des trois elements 
constitutifs ; a titre d'exemple, la modification peut intervenir soit au niveau des 
bases, avec des bases modifiees telles que l'inosine, la methyl-5desoxycytidine, la 
desoxyuridine, la dimemylamino-5desoxyuridine, la diamino-2,6-purine, la 
bromo-5desoxyuridine ou toute autre base modifiee capable d*hybridation, soit au 
niveau du sucre, par exemple le remplacement d'au moins un desoxyribose par un 
polyamide (P.E. Nielsen et al, Science, 254, 1497-1500 (1991), soit encore au niveau 
du groupement phosphate, par exemple son remplacement par des esters notamment 
choisis parmi les diphosphates, alkyl- et aryl-phosphonates et phosphorothioates. 

Selon un mode particulier de realisation de Pinvention, le reactif specifique 
comprend au moins une amorce d'amplification. Au sens de la presente invention, on 
entend par amorce d'amplification, un fragment nucleotidique comprenant de 5 a 1 00 
motifs nucleiques, preferentiellement de 15 a 30 motifs nucleiques permettant 
i'initiation d'une polymerisation enzymatique, telle que notamment une reaction 
d'amplification enzymatique. Selon un mode particulier de realisation de l'invention, 
1'amorce d'amplification comprend une sequence choisie parmi les SEQ ID N°38 a 
41 et SEQ ID N°44 a 45. Par reaction d'amplification ^vmati,,^ on en iend un 
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processus generant de multiples copies d'un fragment nucleotidique par Taction d'au 
moins une enzyme. De telles reactions d'amplification sont bien connues de l'homme 
du metier et on peut citer notamment les techniques suivantes : 

PCR (Polymerase Chain Reaction), telle que decrite dans les brevets US 
4,683,195, US 4,683,202 etUS 4,800,159, 

LCR (Ligase Chain Reaction), exposee par exemple dans la demande de 
brevet EP 0 201 184, 

RCR (Repair Chain Reaction), decrite dans la demande de brevet WO 

90/01069, 

3SR (Self Sustained Sequence Replication) avec la demande de brevet WO 
90/06995, 

NASBA (Nucleic Acid Sequence-Based Amplification) avec la demande de 
brevet W O 91/02818, et 

TMA (Transcription Mediated Amplification) avec le brevet US 5,399,491 . ; . 
Lorsque 1'amplification enzymatique est une PCR, le reactif specifique comprend au* ; 
moins 2 amorces d'amplification, specifiques d'un .gene cible, et permettent, 
1'amplification du materiel specifique du gene cible. Le materiel specifique du gene, 
cible comprend alors preferentiellement un ADN complementaire obtenu par, 
transcription inverse d'ARN messager issu du gene cible (on parle alors d'ADNc 
specifique du gene cible) ou un ARN complementaire obtenu par transcription des 
ADNc specifique d'un gene cible (on parle alors d'ARNc specifique du gene cible). 
Lorsque l'amplification enzymatique est une PCR realisee apres une reaction de 
transcription reverse, on parle de RT-PCR. 

Selon un autre mode prefere de r6alisation de l'invention, le reactif specifique de 
l'6tape b) comprend preferentiellement une sonde d'hybridation. 
Par sonde d'hybridation , on entend un fragment nucleotidique comprenant de 5 a 100 
motifs nucleiques, notamment de 10 a 35 motifs nucleiques, possedant une 
specificite d'hybridation dans des conditions determinees pour former un complexe 
d'hybridation avec le materiel specifique d'un gene cible. Dans la presente invention, 
le materiel specifique du gene cible peut etre une sequence nucleotidique comprise 
dans un ARN messager issu du gene cible (on parle alors d'ARNm sp6cifique du 
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gene cible), une sequence nucleotidique comprise dans un ADN complementaire 
obtenu par transc ription in verse dudit ARN messager (on parle alors d'ADNc 
specifique du gene cible), ou encore une sequence nucleotidique comprise dans un 
ARN complementaire obtenu par transcription dudit ADNc tel que decrit 
precedemment (on parlera alors d'ARNc specifique du gene cible). La sonde 
d'hybridation peut comprendre un marqueur permettant sa detection. Par detection on 
entend soit une detection directe par une methode physique, soit une detection 
indirecte par une methode de detection a l'aide d'un marqueur. De nombreuses 
methodes de detection existent pour la detection des acides nucleiques. [Voir par 
exemple Kricka et al., Clinical Chemistry, 1999, n° 45(4), p.453-458 ou Keller G.H. 
et al., DNA Probes, 2nd Ed., Stockton Press, 1993, sections 5 et 6, p.173-249]. Par 
marqueur, on entend un traceur capable d'engendrer un signal que Ton peut detecter. 
Une liste non l imitative d e ces traceurs comprend les enzymes qui produisent un 
signal detectable par exemple par colorimetrie, fluorescence ou luminescence, 
comme la peroxydase de raifort, la phosphatase alcaline, la beta galactosidase, la 
glucose-6-phosphate dehydrogenase; les chromophores comme les composes 
fluorescents, luminescents ou colorants ; les groupements a densite electronique 
detectables par microscopie electronique ou par leurs proprietes electriques comme la 
conductivity, par les methodes d'amperometrie ou de voltametrie, ou par des mesures 
d'impedance ; les groupements detectables par des methodes optiques comme la 
diffraction, la resonance plasmon de surface, la variation d'angle de contact ou par 
des methodes physiques comme la spectroscopic de force atomique, I'effet tunnel, 
etc. ; les molecules radioactives comme 32 P, 35 S ou ,25 I. 

Au sens de la presente invention, la sonde d'hybridation peut 6tre une sonde dite de 
detection . Dans ce cas, la sonde dite de detection est marquee au moyen d'un 
marqueur tel que defmi precedemment La sonde d'hybridation peut Stre egalement 
une sonde dite de capture. Dans ce cas, la sonde dite de capture est immobilisee ou 
immobilisable sur un support solide par tout moyen approprie, c'est-a-dire 
directement ou indirectement, par exemple par covalence ou adsorption. Comme 
support solide, on peut utiliser des materiaux de synthese ou des materiaux naturels, 
eventuellement modifies chimiquement, notanunent les polysaccharides tels que les 
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materiaux a base de cellulose, par exemple du papier, des derives de cellulose tels 
que l'acetate de cellulose et la nitrocellulose ou le dextrane, des polymere s, des 
copolymeres, notamment a base de monomeres du type styrene, des fibres naturelles 
telles que le coton, et des fibres synthetiques telles que le nylon ; des materiaux 
mineraux tels que la silice, le quartz, des verres, des ceramiques ; des latex ; des 
particules magnetiques ; des derives metalliques, des gels etc. Le support solide peut 
etre sous la forme d'une plaque de microtitration, d'une membrane comme decrit dans 
la demande WO-A-94/12670, d'une particule. On peut egalement immobiliser sur le 
support plusieurs sondes de capture differentes, chacune etant specifique d'un g&ie 
cible. En particulier, on peut utiliser comme support une biopuce sur laquelle peuvent 
etre immobilisees un grand nombre de sondes. Par biopuce, on entend un support 
solide de dimension reduite ou sont fixee une multitude de sondes de capture a des 
positions predeterm ines. Le co ncept de biopuce, ou puce a ADN, date du debut des 
annees 90. II repose sur une technologie pluridisciplinaire integrant la micro- 
electronique, la chimie des acides nucleiques, 1' analyse d'images et l'informatique;. 
Le principe de fonctionnement repose sur un fondement.de labiologie moleculaire,: 
le phenomene d'hybridation, c'est-a-dire l'appariement par complementarite de^ 
bases de deux sequences d'ADN et/ou d'ARN. La methode des biopuces repose sax-, 
l'emploi de sondes de capture fixees sur un support solide sur lesquelles on fait agir 
un echantillon de fragments nucleotidiques cibles marques directement ou 
indirectement avec des fluorochromes. Les sondes de capture sont positionnees de 
maniere specifique sur le support ou puce et chaque hybridation donne une 
information particuliere, en relation avec le fragment nucl6otidique cible. Les 
informations obtenues sont cumulatives, et permettent par exemple de quantifier le 
niveau d'expression d'un gene ou de plusieurs genes cibles. Pour analyser 
l'expression d'un gene cible, on peut alors r6aliser une biopuce portant de tres 
nombreuses sondes qui correspondent a tout ou partie du gene cible, qui est transcrit 
en ARNm. On hybride alors par exemple les ADNc ou les ARNc specifiques d'un 
gene cible que l'on souhaite analyser sur des sondes de capture specifique. Apres 
hybridation, le support ou puce est lave(e), et les complexes ADNc ou ARNc 
marquees / sondes de capture sont reveles par un ligand de forte affinite lie par 
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exemple k un marqueur de type fhiorochrome. La fluorescence est lue par exemple 
par un scanner et l'analyse de la fluores cence est traitee par informatique. On peut 
citer a titre indicatif, les puces a ADN mises au point par la societe Affymetrix 
("Accessing Genetic Information with High-Density DNA arrays", M. Chee et al., 
Science, 1996, 274, 610-614. "Light-generated oligonucleotide arrays for rapide 
DNA sequence analysis", A. Caviani Pease et al., Proc. Natl. Acad. Sci. USA, 1994, 
91, 5022-5026), pour les diagnostics moleculaires. Dans cette technologie, les sondes 
de capture sont generalement de tallies reduites, autour de 25 nucleotides. D'autres 
exemples de hiopuces sont donnes dans les publications de G. Ramsay, Nature 
Biotechnology, 1998, n°16, p. 40-44 ; F. Ginot, Human Mutation, 1997, n°10, p.l- 
10; J. Cheng et al, Molecular diagnosis, 1996, n°l(3), p.183-200 ; T. Livache et al, 
Nucleic Acids Research, 1994, n° 22(15), p. 2915-2921 ; J. Cheng et al, Nature 
Biotechnology, 1998, n° 16 , p^l-5 46 ou dans les brevets US-A-4,98 1,783, US-A- 
5,700,637, US-A-5,445,934, US-A-5,744,305 et US-A-5,807,522. La camcteristiqueT 
principale du support solide doit etre de conserver les caracteristiques dliybridation 
des sondes de capture sur les fragments nucleotidiques cibles tout en generant un 
bruit de fond minimum pour la m<§thode de detection. 

Pour l'immobilisation des sondes sur le support, on distingue trois grands types de 
fabrication. 

n y a, tout d'abord, une premiere technique qui consiste en un dep6t de 
sondes pre-synthetisees. La fixation des sondes se fait par transfer! direct, au moyen 
de micropipettes, de micro-pointes ou par un dispositif de type jet d'encre. Cette 
technique permet la fixation de sondes de taille allant de quelques bases (5 a 10) 
jusqu'a des tailles relativement importantes de 60 bases (impression) a quelques 
centaines de bases (micro-deposition) : 

L'impression est une adaptation du proced6 utilise par les imprimantes a jet 
d'encre. Elle repose sur la propulsion de tres petites spheres de fluide (volume <1 nl) 
et a un rythme pouvant atteindre 4000 gouttes/secondes. L'impression n'implique 
aucun contact entre le systeme liberant le fluide et la surface sur laquelle il est 
depose. 
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La micro-deposition consiste a fixer des sondes longues de quelques dizaines 
k plusieurs centaines de bases a la surface d'une lame de verre. Ces sondes sont 
generalement extraites de bases de donnSes et se presentent sous forme de produits 
amplifies et purifies. Cette technique permet de r&tliser des puces denommees 

5 microarrays portant environ dix mille spots, dit zones de reconnaissance, d' ADN sur 
une surface d'un peu moins de 4 cm2. Il--ne faut toutefois pas oublier Pemploi de 
membranes de Nylon, dites « macroarrays », qui portent des produits amplifies, 
generalement par PCR, avec un diametre de 0,5 a 1 mm et dont la densite maximale 
est de 25 spots/cm2. Cette technique tres flexible est utilisee par de nombreux 

10 laboratoires. Dans la presente invention, cette derniere technique est consider6e 
comme faisant partie des biopuces. On peut toutefois deposer en fond de plaque de 
microtitration un certain volume d'echantillon dans chaque puits, comme c'est le cas 
dans les demandes de brevet WO- A-00/71750 et FR 00/14896, ou deposer. au fond 
d'une meme boite de P6tri un certain nombre de gouttes s6par6es les unes des autres, 

15 selon une autre demande de brevet FR00/1 4691 . 

La deuxieme technique de fixation des sondes sur le support ou puce est 
appelee la synthese in situ. Cette technique aboutit a V elaboration de sondes courtes 
directement a la surface de la puce. Elle repose sur la synthese d' oligonucleotides in 
situ (voir notamment les demandes de brevet WO 89/10977 et WO 90/03382), et est 

20 fondee sur le procede des synth&iseurs d'oligonucleotides. Elle consiste h deplacer 
une chambre de reactions, ou se d£roule la reaction d'elongation d'oligonucleotides, 
le long de la surface de verre. 

Enfin, la troisieme technique est appelee la photolithographic, qui est un 
procede a Torigine des biopuces developpees par Aflfymetrix. H s'agit egalement 

25 d'une synthese in situ. La photolithographic est deriv6e des techniques des 
microprocesseurs. La surface de la puce est modifiee par la fixation de groupements 
chimiques photolabiles pouvant etre actives par la lumiere. Une fois illumin6s, ces 
groupes sont susceptibles de reagir avec rextr6mite 3' d'un oligonucleotide. En 
protegeant cette surface par des masques de formes definies, on peut illuminer et 

30 done activer seiectivement des zones de la puce ou Ton souhaite fixer Tun ou V autre 
des quatre nucleotides. L'utilisation successive de masques differents permet 
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d'alterner des cycles de protection/reaction et done de realiser les sondes 
d' oligonucleotides sur des spots d'environ quelques dizaines de micrometre carre 
(\xm2). Cette resolution permet de cr^er jusqu'a plusieurs centaines de milliers de 
spots sur une surface de quelques centimetres carr£ (cm2). La photolithographic 
pr£sente des avantages : massivement parallele, elle permet de creer une puce de N- 
meres en seulement 4 x N cycles. Toutes ces techniques sont bien entendues 
utilisables avec la presente invention. Selon un mode pr£fere de realisation de 
l'invention, le au moins un reactif specifique de l'etape b) definie precedemment 
comprend au moins une sonde d'hybridation, qui est preferentiellement immobilisee 
sur un support Ce support est preferentiellement une biopuce telle que definie 
precedemment. 

Lors de l'etape c) la determination de l'expression d'un gene cible peut etre realisee 
par tous les protocoles connus de Thomme du metier. 

D'une manidre generate, ^expression d'un gene cible peut etre analysee par la 
detection des ARNm (ARN messagers) qui sont transcrits du gene cible a un instant 
donne ou par la detection des proteines issues de ces ARNm. 

L'invention conceme preferentiellement la determination de Pexpression d'un gene 
cible par la detection des ARNm issus de ce g£ne cible selon tous les protocoles bien 
connus de lTiomme du metier. Selon un mode particulier de realisation de 
l'invention, on determine simultanement Texpression de plusieurs genes cibles, par 
la detection de plusieurs ARNm differents, chaque ARNm etant issus d'un gene 
cible. 

Lorsque le reactif specifique comprend au moins une amorce d'amplification, on 
peut, lors de Petape c) du procede selon l'invention, determiner Texpression d'un 
gene cible de la maniere suivante: 

1) apres avoir extrait comme materiel biologique, les ARN totaux 
fcomprenant les ARN de transfert (ARNt), les ARN ribosomaux (ARNr) et les ARN 
messagers (ARNm)) d f un echantillon biologique tel que presente precedemment, on 
realise une etape de transcription reverse afin d ! obtenir les ADN compiementaires (ou 
ADNc) desdits ARNm. A titre indicatif, cette reaction de transcription reverse peut 
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etre realisee a l'aide d'une enzyme reverse transcriptase qui permet d'obtenir, a partir 
d'un fragment d'ARN, un fragment d'ADN complementaire. On peut utiliser 
notamment l'enzyme reverse transcriptase provenant de l'AMV (Avian Myoblastosis 
Virus) ou de MMLV (Moloney Murine Leukaemia Virus). Lorsque Ton souhaite plus 
particulierement obtenir uniquement les ADNc des ARNm, on realise cette etape de 
transcription reverse en presence de fragments nucteotidiques comprenant 
uniquement des bases thymine (polyT), qui s'hybrident par complementarity sur la 
sequence polyA des ARNm afin de former un complexe polyT-polyA qui sert alors 
de point de depart a la reaction de transcription reverse realisee par l'enzyme reverse 
transcriptase. On obtient alors des ADNc complementaires des ARNm issus d'un 
gene cible (ADNc specifique du gene cible) et des ADNc complementaires des 
ARNm issus d'autres genes que le g&ie cible (ADNc non specifique du gene cible). 

2) on met en contact la ou les amorces d' amplification specifiques d'un gene 
cible avec les ADNc specifique du gene cible et les ADNc non specifique du gene 
cible. La ou les amorces d'amplification specifiques d'un gene cible s'hybrident avec 
les ADNc specifique du gene cible et on amplifie specifiquement urie region 
predeterminee, de longueur connue, des ADNc provenant des ARNm issus, du gdne 
cible. Les ADNc non specifiques du gene cible ne sont pas amplifies, alo'ts qu'on 
obtient alors une grande quantite d'ADNc specifiques du gene cible. Au sens de la 
presente invention, on parte indifferemment d' « ADNc specifiques du gene cible » 
ou d' « ADNc provenant des ARNm issus du gene cible ». Cette etape peut etre 
realisee notamment par une reaction d'amplification de type PCR ou par toute autre 
technique d'amplification telle que definie precedemment. En PCR, on peut 
egalement amplifier simultanement plusieurs ADNc differents, chacun etant 
specifique de different gene cible par l'utilisation de plusieurs couples d'amorces 
d'amplification differentes, chacune etant specifique d'un gene cible: on parte alors 
d'amplification en multiplex. 

3) on determine l'expression du gene cible en detectant et quantifiant les 
ADNc specifiques du gene cible obtenus lors de I'&ape 2) ci dessus. Cette detection 
peut etre r6alisee apres migration par electrophorese des ADNc sp6cifiques du gene 
cible en fonction de leur taille. Le gel et le milieu de migration peuvent comprendre 
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du bromure d'ethydium afin de permettre la detection directe des ADNc specifiques 
du gene cible lorsque le gel est place, apres un temps de migration donne, sur une 
table lumineuse a rayons UV (ultra violet) par remission d'un signal lumineux. Ce 
signal est d'autant plus lumineux que la quantite des ADNc specifique du gene cible 
est importante. Ces techniques d'electrophorese sont bien connues de l'homme du 
metier. Les ADNc sp6cifiques du gene cible peuvent egalement 6tre detectes et 
quantifies par l'utilisation d'une gamme de quantification obtenue par une reaction 
d'amplification conduite jusqu'a saturation. Afin de tenir compte de la variabilite 
d'efficacite enzymatique qui peut etre observee lors des differentes etapes 
(transcription reverse, PCR...), on peut normaliser 1'expression d'un gene cible de 
differents groupes de patients, par la determination simultanee de 1'expression d'un 
gene dit de menage, dont 1'expression est similaire chez les differents groupes de 
patients. En realisant un rapport entre 1'expression du gene cible et 1'expression du 
gene de menage, c'est a dire en realisant un rapport entre la quantite d'ADNc 
specifiques du gene cible, et la quantit6 d'ADNc specifiques du gene de menage, on 
corrige ainsi toute variabilite entre les differentes experimentations. L'homme du 
metier pourra se referer notamment aux publications suivantes : Bustin SA Journal of 
molecular endocrinology, 2002, 29 : 23-39 ; Giulietti A Methods, 2001, 25 : 386- 
401. 

Lorsque le reactif spdcifique comprend au moins une sonde d'hybridation, on peut 
determiner 1'expression d'un gene cible de la maniere suivante: 

1) apres avoir extrait, comme materiel biologique, les ARN totaux d'un 
echantillon biologique tel que presente precedemment, on realise une etape de 
transcription reverse, telle que decrite precedemment afin des ADNc 
complementaires des ARNm issus d'un gene cible (ADNc specifique du gene cible) 
et des ADNc complementaires des ARNm issus d'autres genes que le gene cible 
(ADNc non sp6cifique du gene cible). 

2) on met en contact tous les ADNc avec un support, sur lequel sont 
immobilisees des sondes de capture specifiques du gene cible dont on souhaite 
analyser 1'expression, afin de realiser une reaction d'hybridation entre les ADNc 
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specifiques du gene cible et les sondes de capture, les ADNc non specifiques du gene 
cible ne s'hybridant pas sur les sondes de capture. La faction d'hybridation peut etre 
r6alisee sur un support solide qui inclut tous les materiaux tels qu'indique 
precedemment. Selon un mode prefere de realisation, la sonde d'hybridation est 
immobilisee sur un support. Preferentiellement, le support est une biopuce. La 
faction d'hybridation peut etre precedee d'une etape d' amplification enzymatique 
des ADNc specifique du gene cible telle que decrite prec6demment pour obtenir une 
grande quantite d' ADNc specifiques du gene cible et augmenter la probability qu'un 
ADNc specifique d'un gene cible s'hybride sur une sonde de capture sp6cifique du 
gene cible. La reaction d'hybridation peut egalement etre precedee d'une etape de 
marquage et/ou de clivage des ADNc specifiques du gene cible telle que decrite 
precedemment, par exemple en utilisant un desoxyribonucleotide triphosphate 
marque pour la reaction d'amplification. Le clivage peut etre realise notamment par 
Faction de l'imidazole et de chlorure de manganese. L' ADNc specifique du gene cible" 
peut aussi etre marque apres l'etape d'amplification, par exemple en hybridant une 
sonde marquee selon la technique d'hybridation sandwich d6crite dans le document" 
WO-A-91/19812. D'autres modes particuliers preferentiels de marquage et/ou 
clivage d'acides nucleiques sont decrit dans les demandes WO 99/65926, WO 
01/44507, WO 01/44506, WO 02/090584, WO 02/090319. 

3) on realise ensuite une etape de detection de la reaction d'hybridation. La 
detection peut etre realisee par la mise en contact du support sur lequel sont hybrides 
les sondes de capture specifique du gene cible avec les ADNc specifiques du gene 
cible avec une sonde dite de detection, marquee par un marqueur, et on detecte le 
signal emis par le marqueur. Lorsque l'ADNc specifique du gene cible a 6t6 
prealablement marque par un marqueur, on detecte directement le signal emis par le 
marqueur. 

Lorsque le au moins un reactif specifique mis en contact l'etape b) du procede 
selon l'invention comprend au moins une sonde d'hybridation, on peut egalement 
determiner l'expression d'un gene cible de la maniere suivante: 
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1) apres avoir extant, comme materiel biologique, les ARN totaux d'un 
echantillon biologique telle que presentee precedernment, on realise une etape de 
transcription reverse, telle que decrite precedernment afin d'obtenir les ADNc des 
ARNm du materiel biologique. On realise ensuite la polymerisation de l'ARN 
complementaire du ADNc par l'utilisation d'une enzyme polymerase de type T7 
polymerase qui fonctionnent sous la dependance d'un promoteur et qui permettent 
d'obtenir, a partir d'une matrice d'ADN, l'ARN complementaire. On obtient alors les 
ARNc des ADNc des ARNm specifiques du gene cible (on parle alors d'ARNc 
specifique du gene cible) et les ARNc des ADNc des ARNm non specifiques du gene 
cible. 

2) on met en contact tous les ARNc avec un support, sur lequel sont 
immobilisees des sondes de capture specifiques du gene cible dont on souhaite 
analyser 1'expression, afin de realiser une reaction d'hybridation entre les ARNc 
specifiques du gene cible et les sondes de capture, les ARNc non specifiques du gene 
cible ne s'hybridant pas sur les sondes de capture. Lorsque l'on souhaite analyser 
simultanement 1'expression de plusieurs genes cibles, on peut immobiliser sur le 
support plusieurs sondes de capture differentes, chacune etant specifique d'un gene 
cible. La reaction d'hybridation peut egalement etre precedee d'une etape de 
marquage et/ou de clivage des ARNc specifiques du gene cible telles que decrites 
precedernment. 

3) on realise ensuite une etape de detection de la reaction d'hybridation. La 
d6tection peut etre realisee par la mise en contact du support sur lequel sont 
hybridees les sondes de capture specifiques du gene cible avec l'ARNc specifique du 
gene cible avec une sonde dite de detection, marquee par un marqueur, et on detecte 
le signal emis par le marqueur. Lorsque l'ARNc specifiques du gene cible a ete 
prealablement marque par un marqueur, on detecte directement le signal emis par le 
marqueur. L'utilisation d'ARNc est particulierement avantageux lorsqu'on utilise un 
support de type biopuce sur lequel est hybrides un grand nombre de sondes. 

L'analyse de 1'expression d'un gene cible choisi parmi 1'une quelconque des SEQ ID 
N°l a 37 permet alors de disposer d'un outil pour le pronostic du neuroblatome. On 
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peut par example analyser Pexpression (Tun gene cible chez un patient dont on ne 
connait pas le pronostic, et comparer avec des valeurs d'expression moyenne connues 
du gene cible de patients de bon pronostic et des valeurs d'expression moyenne 
connues du gene cible de patients de mauvais pronostic. Ceci pennet de determiner si 
5 le patient est de bon ou de mauvais pronostic afin de lui proposer un traitement 
adapte. 

Selon un mode prefere de realisation de Pinvention, lors de Petape b) on met en 
contact le materiel biologique avec au moins 37 reactifs specifiques choisis parmi les 
10 reactifs specifiques des g&nes cibles presentant une sequence nucl&que ayant Pune 
quelconque des SEQ ID N° 1 a 37 et on determine, lors de Petape c, Pexpression 
d'au moins 37 desdits g6nes cibles. 

Selon un autre mode prefere de realisation, lors de Petape b) on met en contact le 
materiel biologique avec au moins 2, au moins 3, au moins 4, au moins 5, au moins. 

15 6, au moins 7, au moins 8, au moins 9, au moins 10, au moins 1 1, au moins 12, au f 
moins 13, au moins 14, au moins 15, au moins 16, au moins 17, au moins 18, au'< 
moins 19, au moins 20, au moins 21, au moins 22, au moins 23, au moins 24, au \ 
moins 25, au moins 26, au moins 27, au moins 28, au moins 29, au moins 30, au 
moins 31, au moins 32, au moins 33, au moins 34, au moins 35, ou au moins 36 

20 reactifs specifiques choisis parmi les reactifs specifiques des genes cibles presentant 
une sequence nucleique ayant Pune quelconque des SEQ ID N° 1 a 37 et on 
determine, lors de Petape c, Pexpression d'au moins au moins 2, au moins 3, au 
moins 4, au moins 5, au moins 6, au moins 7, au moins 8, au moins 9, au moins 1 0, 
au moins 1 1, au moins 12, au moins 13, au moins 14, au moins 15, au moins 16, au 

25 moins 17, au moins 18, au moins 19, au moins 20, au moins 21, au moins 22, au 
moins 23, au moins 24, au moins 25, au moins 26, au moins 27, au moins 28, au 
moins 29, au moins 30, au moins 31, au moins 32, au moins 33, au moins 34, au 
moins 35, ou au moins 36 desdits genes cibles. 

Selon un autre mode prefSre de realisation, lors de Petape b) on met en contact le 
30 materiel biologique avec au moins 19 reactifs specifiques choisis parmi les reactifs 
specifiques des gdnes cibles presentant une sequence nucleique ayant la SEQ ID 
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N°l ; SEQ ID N°2; SEQ ID N°3; SEQ ID N°7; SEQ ID N°8; SEQ ID N°9; SEQ ID 
N°10; SEQ ID N°14; SEQ ID N°16; SEQ ID N°20; SEQ ID N°21; SEQ ID N°22; 
SEQ ID N°25; SEQ ID N°27; SEQ ID N°29; SEQ ID N°31; SEQ ID N°34; SEQ ID 
N°36 ou SEQ ID N°37 on determine, lors de P6tape c) Pexpression d'au moins 19 

5 desdits genes cibles. 

Selon un autre mode prefere de realisation, lors de Petape b) on met en contact le 
materiel biologique avec au moins 2, au moins 3, au moins 4, au moins 5, au moins 
6, au moins 7, au moins 8, au moins 9, au moins 10, au moins 1 1, au moins 12, au 
moins 13, au moins 14, au moins 15, au moins 16, au moins 17, au moins 18, ou au 

10 moins 19 reactifs specifiques choisi parmi les reactifs specifiques des genes cibles 
presentant une sequence nucleique ayant la SEQ ID N°l ; SEQ ID N°2; SEQ ID N°3; 
SEQ ID N°7; SEQ ID N°8; SEQ ED N°9; SEQ ID N°10; SEQ ID N°14; SEQ ID 
N°16; SEQ ID N°20; SEQ ID N°21; SEQ ID N°22; SEQ ID N°25; SEQ ID N°27; 
SEQ ID N°29; SEQ ID N°31; SEQ ID N°34; SEQ ID N°36 ou SEQ ID N°37 on 

15 determine, lors de P&ape c) Pexpression d'au moins 2, au moins 3, au moins 4, au 
moins 5, au moins 6, au moins 7, au moins 8, au moins 9, au moins 10, au moins 1 1, 
au moins 12, au moins 13, au moins 14, au moins 15, au moins 16, au moins 17, au 
moins 18, ou au moins 19 desdits g&ies cibles. 

20 Les figures ci-jointes sont donnees a titre d'exemples explicatifs et n'ont 

aucun caractere limitatif. Elles permettront de mieux comprendre P invention. 

La figure 1 presente un dendogramme obtenu a partir de 23 echantillons de 
tumeurs issus de patients de bon pronostic (BP) ou de mauvais pronostic (MP), et 
Putilisation d'un panel de 40 sondes permettant Panalyse de Pexpression des 37 

25 genes presents pr6c<§demment dans le tableau 1. On retrouve sur ce dendograme 23 
colonnes correspondant aux 23 echantillons de tumeurs, et 40 lignes correspondant 
aux 40 sondes utilises pour Panalyse de Pexpression des 37 genes. Les Echantillons 
de tumeurs, ainsi que les genes ayant un profil d* expression comparable, mis en 
Evidence par une correlation de type Pearson, ont ete places cote a cote. Les 

30 echantillons de tumeurs ont et6 classes selon la m&hode de moyenne non-ponder6e 
(Spotfire Decision Site for Functional Genomics V7.1, manual) aiors que les gSnes 
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ont et6 classes selon la valeur moyenne d'expression obtenue dans P ensemble des 
echantillons. Le niveau d'expression de chaque gene, calcule par le logiciel 
Microarray Suite (MAS5.0, Asymetrix) est reprSsente par differents niveaux de 
couleur. Ainsi, la couleur blanche correspond a un faible niveau d'expression, la 
couleur grise correspond a un niveau d'expression intermediate, alors que la couleur 
noire correspond a un fort niveau d'expression. La longueur des branches du 
dendograme est corr&ee au profil d'expression et la ligne en pointillee qui divise le 
dendograme permet de distinguer deux groupes de patients : un prejnier groupe de 
patients de mauvais pronostic "MP'* et un deuxieme groupe de patients de bon 
pronostic "BP". Les six tumeurs "MP-tesf ' et « BP-test » sont des tumeurs qui ont ete 
analysees « en aveugle », c'est a dire sans connaitre leur pronostic. 

La figure 2 presente un dendogramme obtenu k partir de 23 echantillons de, 
tumeurs issus de patients de bon pronostic ou de mauvais pronostic, et P analyse de 
Pexpression de 19 genes. Ce dendogramme a ete obtenu comparablement a ce qui est 
d6crit pour la figure 1 . 

La figure 3 presente un dendogramme obtenu a partir de 23 echantillons de 
tumeurs issus de patients de bon pronostic ou de mauvais pronostic, et P analyse de 
Pexpression de 16 genes. Ce dendogramme a ete obtenu comparablement a ce qui est 
d6crit pour la figure 1 . 

La figure 4 presente un dendogramme obtenu a partir de 23 echantillons de 
tumeurs issus de patients de bon pronostic ou de mauvais pronostic, et Panalyse de 
Pexpression de 12 genes. Ce dendogramme a ete obtenu comparablement a ce qui est 
decrit pour la figure 1 . 

La figure 5 presente un dendogramme obtenu a partir de 23 echantillons de 
tumeurs issus de patients de bon pronostic ou de mauvais pronostic, et Panalyse de 
Pexpression de 9 g&ies. Ce dendogramme a ete obtenu comparablement a ce qui est 
d6crit pour la figure 1 . 

Les exemples suivants sont donnes k titre illustratif et n'ont aucun caractere 
limitatif. lis permettront de mieux comprendre Pinvention. 
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Exemple 1 : Recherche d'un profil depression pour le pronostic du 
neuroblastome 

Caracteristiques des echantillons bioloziaues (tumeurs localisees ou ponctions de 
moelles osseuses) : 23 echantillons de neuroblatome, obtenus aupr£s du Centre L6on 
Berard (CLB) de Lyon, France, ont ete utilisees dans cette etude. Ces echantillons de 
neuroblastome ont ete preleves prealablement a tout traitement th6rapeutique. 
Chaque tumeur a ete classee suivant la classification INSS (International 
Neuroblastoma Staging System; Brodeur et al ; (1993) J. Clin. Oncol 11, 1466-77), 
On distinguait alors 12 tumeurs de stade 1/2, 4 tumeurs de stade 4s et 7 echantillons 
de stade 4. (2 ponctions tumorales, 1 biopsie, 4 ponctions medullaires massivement 
envahies. L'analyse histochimique montrait dans les tumeurs localisees la presence 
d'environ 80% de cellules tumorales. L'analyse immunocytochimique montrait 
egalement dans les ponctions de moelle osseuse la presence d'environ 80% de 
cellules tumorales, L'age median des patients au moment du diagnostic du 
neuroblastome etait de 10 mois et demi, et 5 patients sont decedes au cours de la 
periode de suivi median de 75 mois, Les patients ayant decede au cours de Petude, et 
les patients pr6sentant un neuroblatome de stade IV 6taient qualifies de patients de 
mauvais pronostic (MP), alors que les patients en vie, ayant developpe un 
neuroblastome de stade 1, 2 et 4s etaient qualifies de patients de bon pronostic (BP) 
(qualification selon Brodeur, 2003, Nat Rev Cancer, 203-216). Cette analyse a ainsi 
ete realisee sur 8 patients MP et 1 5 patients BP, 

Extraction du materiel biolomque (ARN totaiix) de Vechantillon biolozique : les 
ARN totaux ont ete extraits de chaque tumeur ou ponction de moelle osseuse selon 
un protocole bien connu de Fhomme du metier (Voir notamment Ausubel et al 
(1997), Current protocols in Molecular Biology, Volume 1, John Wiley and Sons, 
New York). Pour cela, chaque Schantillon biologique a ete homogeneise dans 1 ml de 
Trizol (Invitrogen, Cergy Pointoise, France), et traite avec 300 |il de chloroforme afin 
d'eliminer tout contaminant prot&que et lipophile. Les ARN totaux ont ensuite ete 
prScipites avec 750 fxl d'isopropanol, laves deux fois avec une solution a 80 % en 
ethanol (vol/vol) et remis en solution dans de Teau DEPC. Les ARN totaux ont 
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ensuite ete purifies sur colonne Qiagen RNeasy (Qiagen, Hilden, Germany) 
conformement aux instructions du fabriquant, a l'exception de Pelution finale qui a 
ete realisee dans 200 |il d'eau RNAse-free apres 1 min d'incubation a 65°C 
Prealablement a Petape de transcription reverse, une etape de precipitation par de 
5 Pac&ate d'ammonium (0,5 vol, 7.5M) et de Pethanol (2,5 vol) a ete realisee pour 
garantir la purification des ARN totaux. La qualite des ARN totaux a ete analysee par 
le bio analyseur AGILENT 2100 (Agilent Technologies, Waldbronn, Germany). Les 
ARN totaux comprennent les ARN de transfert, les ARN messagers (ARNm) et les 
ARN ribosomaux. 

10 Svnthese d'ADNc, obtention des ARNc et marquaze des ARNc et quantification : 
Afin d'analyser ^expression des genes cibles selon Pinvention, les ADN 
complementaires (ADNc) des ARNm contenus dans les ARN totaux tels que purifies 
ci dessus, ont 6te obtenus a partir de 10 fig d'ARN totaux par Putilisation de 400 
unites de Penzyme de transcription reverse SuperScriptn (Invitrogen) et 100 pmol, 

15 d' amorce poly-T contenant le promoteur de la T7 promotor (T7-oligo(dT)24-primer > , 
Proligo, Paris, France). Les ADNc ainsi obtenus ont ensuite ete extraits avec du,. 
phenol/chloroforme, et pr6cipites tels que decrit precedemment par de Pacetate, 
d'ammonium et de Pethanol, et remis en solution dans 24 jil d'eau DEPC. Un. 
volume de 20 \x\ de cette solution purifiee d'ADNc a fait Pobjet ensuite d'une 

20 transcription in vitro par Putilisation d'une ARN polymerase T7 qui reconnait 
sp6cifiquement le promoteur de la T7 polymerase tel que mentionne ci dessus. Cette 
transcription permet d'obtenir PARNc de PADNa Cette transcription a ete realisee 
par Putilisation d'un kit Bioarray High Yield RNA Transcript Labeling Kit (Enzo 
Diagnostics, Farmingdale, NY), qui permet non seulement d'obtenir PARNc mais 

25 egalement Incorporation de bases cytidine et uridine biotinylees lors de la synthese 
de PARNc . 

Les ARNc purifies ont ensuite ete quantifies par spectrophotometries et la solution 
d'ARNc a ete ajustee a une concentration de 1 jig/pl d'ARNc. L'etape de clivage de 
ces ARNc a ensuite 6te realisee a 94°C pendant 35 min, par Putilisation d'un tampon 
30 de fragmentation (40 mM de Tris acetate, pH 8,1, 100 mM d'ac&ate de potassium, 
30 mM d'ac&ate de magnesium) afin de provoquer Phydrolyse des ARNc et obtenir 
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des fragments de 35 a 200 bp. Le succds d'une telle fragmentation a 6t6 verifie par 
une electrophorese sur gel d'agarose 1,5%). 

Msg en evidence d'un vrofil d 'expression differential entre les vatients BP et MP 
L' expression d'environ 10 000 genes a 6te analysee et comparee entre les patients BP 
et MP. Pour cela, 10 fig d'ARNc fragmentes issus de chaque echantillon ont ete 
ajoutes a un tampon d'hybridation (Affymetrix) et 200 \x\ de cette solution ont et6 
mis en contact pendant 16 h a 45°C sur une puce depression (Human Genome 
U95Av2 GeneChip® (Affymetrix), qui comporte 12 625 groupes de sondes 
representant environs 10 000 genes selon le protocole d' Affymetrix tel que decrit sur 
le site internet d' Affymetrix (voir notamment a Padresse suivante 
http://www.affymetrix.co^ 

Afin d'enregistrer les meilleures performances d'hybridation et de lavage, des ARN 
qualifies de « controle » biotinyles (bioB, bioC, bioD et ere) et des oligonucleotides 
(oligo B2) ont egalement ete inclus dans le tampon d'hybridation. Apres l'etape 
d'hybridation, la solution d'ARNc biotinylee et hybridee sur la puce, a ete revelee par 
Putilisation d'une solution de streptavidine-phycoeiythrine et le signal a ete amplifie 
par Putilisation d'anticorps anti-streptavidine. I/hybridation a ete realisee dans une 
etuve d'hybridation « GeneChip Hybridisation oven » (Affymetrix), et le protocole 
Euk GE-WS2 du protocole d'Affymetrix a ete suivi. Les etapes de lavage et de 
revelation ont ete realisees sur une station « Fluidics Station 400 » (Affymetrix). 
Chaque puce U95Av2 a ensuite ete analysee sur un scanner Agilent G2500A 
GeneArray Scanner a une resolution de 3 microns afin de reperer les zones hybridees 
sur la puce. Ce scanner permet la detection du signal emis par les molecules 
fluorescentes apres excitation par un laser argon en utilisant la technique du 
microscope h epifluorescence. On obtient ainsi pour chaque position, un signal 
proportionnel a la quantite de ARNc fix6s. Le signal a ensuite ete analyse par le 
logiciel Microarray Suite 5.0 software (MAS5.0, Affymetrix), 

Afin de prevenir les variations obtenues par Putilisation de differentes puces, il a ete 
realise une approche de normalisation globale utilisant le logiciel MAS5.0 
(Affymetrix), qui permet de convertir les donn<§es brutes obtenues pour chaque puce 
en un signal moyen d'une intensity de 500. Les resultats obtenus sur une puce 
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peuvent alors etre compares aux resultats obtenus sur une autre puce. Le logiciel 
MAS5.0 permettait aussi d'inclure un algorithme statistique pour considerer si un 
gene 6tait exprime ou non. Chaque gene reprSsente sur la puce U95Av2 etait couvert 
par 16 a 20 couples de sondes de 25 oligonucleotides. Par couple de sondes, on 
entend une premiere sonde qui s'hybridait parfaitement (on parle alors de sondes PM 
ou perfect match) avec un des ARNc issus d'un gene cible, et une deuxieme sonde, 
identique a la premidre sonde k V exception d'un m6sappariement (on parle alors de 
sonde MM ou mismatched) au centre de la sonde. Chaque sonde MM servait a 
estimer le bruit de fond correspondant a une hybridation entre deux fragments 
nucleotidiques de sequence non complementaire. (Affymetrix technical note 
"Statistical Algorithms Reference Guide" ; Lipshutz, et al (1999) Nat. Genet. 1 
SuppL, 20-24). Deux tumeurs de stade IV presentant un faible pourcentage de genes 
exprimes, du a un biais soit dans la quality des ARNc soit dans l'etape d'hybridation, 
ont ete exclues de r analyse. Les 23 echantillons restant montraient une moyenne de r . ; 
48 % de genes exprimes. y- 
U analyse des donnees d' expression a ete realisee par le logiciel Microsoft Excel, 
logiciel Spotfire Decision Site for Functionnal Genomics V7.1 (Spotfire AB, ;? 
. Gothenburg, Sweden), ainsi que le module PAM (Prediction Analysis in, 
Microarrays) du logiciel de statistiques R (Ihaka & Gentleman (1996) Journal of 
Computational and Graphical Statistics 5, 299-314. ; Tibshirani, et al (2002) Proc. 
Natl. Acad. Sci. 99, 6567-6572). 

A partir des 12625 groupes de sondes, repr6sentant environ 10 000 genes, de la puce, 
les inventeurs ont selection^ les genes pertinents qui etaient corr61es k un mauvais 
pronostic du neuroblastoma 

Pour cela, une premiere etape a consist^ a exclure les genes presentant un niveau 
d'expression comparable entre tous les groupes de patients [Tibshirani, et al Proc. 
Natl. Acad. Sci. 99, 6567-6572]. Les genes non exprim&s chez i' ensemble des 
patients ont egalement ete exclus (logiciel MAS5.0). Enfin, certains genes ont ete 
exclus si la moyenne d'expression des 2 groupes (patients de bon pronostic et patient 
de mauvais pronostic) etait inferieur a 500 ou si le rapport des moyennes 
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d' expression entre les patients de mauvais et de bon pronostics etaient compris entre 
0,7 et 1,3. 

L' expression des 1488 genes restants a ensuite 6te analysee (algorithme PAM, 
Tibshirani, R., Hastie, T., Narasimhan, B. and Chu, G. (2002) Diagnosis of multiple 
5 cancer types by shrunken centroids of gene expression. Proc. Natl. Acad. Sci. 99, 
6567-6572). 

Resultats obtenus: Dans un premier temps, 37 genes permettant de differencier les 
patients de bon et de mauvais pronostic ont ete identifies. L'augmentation ou la 
diminution d'expression de chacun de ces genes, observee chez les patients de 
10 mauvais pronostic par rapport aux patients de bons pronostics est indiquee dans le 
tableau 2. 

15 
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Tableau 2 - liste des 37 genes exprim6s differentiellement dans les neuroblatomes patients BP et MP 



SEQ ID N° 


Description de la sequence 


N° Genbank 


Expression MP vs BP 


1 


Flap structure-specific endonuclease 1 


lNiVJL \Jv i tl A 1 




2 


Ubiquitin-conjugating enzyme E2C 


NM 007019 


augmentee 


3 


Insulin-like growth factor binding protein 
7(MAC25) 


NM 001553 


dimmuee 


4 


Collagen type I, alpha 2 chain 


NM 000089 


diminuee 


5 


Nucleolin 


NM 005381 


augmentee 


6 


Interleukin enhancer binding factor 3 


NM 004516 


augmentee 


7 


cDNA clone FLJ30781 fis 


AK055343 


diminuee 


8 


TIFlbeta zinc finger protein 


X97548 


augmentee 


9 


Likely ortholog of mouse tumor differentially 
expressed 1 TDE1L 


NM 020755 


diminuee 


10 


DKPZp434Dl 1 12_sl 434 (synonym: htes3) cDNA 
clone DKFZp434Dl 112 3' 


AT A^OMI 


A t mi mipp 


11 


N-MYC proto-oncogene 


IN XVI UUjj to 


augmented 


12 


Qty»si11 nnrlpar riVinrmf'Ipnrirotfciri T")2 

polypeptide 16.5kDa 


NM 004597 


augmentee 


13 


DNA replication licensing factor MCM2 


NM 004526 


augmentee 


14 


RuvB-like DNA hehcase TIP49b 


iNM UUOOOO 


augmenie e 


15 


Immediate early protein ETR101 


NM 004907 


augmentee 


16 


RNA binding protein SI, serine-rich domain 


NM 006711 


augmentee 


17 


Ornithine decarboxylase 1 


NM 002539 


augjnentee 


18 


Activity-related cytoskeleton-asso. protein 
(KIAA0278) 


NM 01 5 19 3 


augment6e 


19 


Secretogranin II (chromogranin C) 


NM 003469 


diminu6e 


20 


Structure specific recognition protein 1 


NM 003146 


augmentee 


21 


Collagen type VI, alpha 3 chain 


NM 004369 


diminuee 


22 


Small nuclear ribonucleoprotein polypeptides B 
andBl 


NM uuiuy I 


augmentee 


23 


member B 


NM 006401 


augmentee 


24 


Non-POU domain containing, octamer-binding 


NM 007363 


augmentee 


25 


Peripheral myelin protein 22 


NM 000304 


diminuee 


26 


Small nuclear ribonucleoprotein polypeptide E 


NM 003094 


augmentee 


27 


Putative L-type neutral amino acid transporter 
(KIAA0436) 


AB007896 


diminuee 


28 


Fibrillarin 


NM 001436 


augmentee 


29 


Tripartite motif-containing 2 


NM 015271 


diminuee 


30 


DNA replication licensing factor MCM6 


NM 005915 


augmentee 


31 


Polypyrimidine tract binding protein 1 


NM 002819 


augmentee 


32 


Small nuclear ribonucleoprotein polypeptide A 


NM 004596 


augmentee 


33 


Creatine kinase, brain 


NM 001823 


augmentee 


34 


Erythrocyte membrane protein band 4.1 like3 


! NM 012307 


diminuee 


35 


Hypothetical protein MGC3077 


NM 024051 


augmentee 


36 


Tissue alpha-L-fucosidase 1 


NM 000147 


diminu6e 


37 


Secreted protein acidic and rich in cysteine 


NM 003118 


diminuee 
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Ces resultats ont egalement ete valides par l'utilisation d'une autre technique de 
biologie moleculaire dans laquelle Panalyse de l'expression de genes tel que 
presentes dans le tableau 2 a ete realisee par RT-PCR. 

Pour cela, une reaction de reverse transcription (RT) a ete realisee a partir d'l ug 
d'ARN total tel qu'obtenu precedemment (kit Amersham, First strand cDNA 
synthesis kit). La transcription reverse a ete effectuee pendant 1 h a 37°C. Chaque 
solution de cDNA a ete diluee 6 fois avant la realisation de la PCR. 
L'expression des ARNm de genes du tableau 2 (Peripheral myelin protein ou PMP22 
(SEQ ID N°25) ; Insulin-like growth factor binding protein ou IGFBP7 (SEQ ID 
N°3 ; SPARC (SEQ ID N°37); EPB41L3 (SEQ ID N°34)) a ensuite ete analyse par 
PCR (polymerase chain reaction) et l'utilisation d'amorces d' amplification 
specifiques (amplification du gene PMP22 : brin sens: 5-AGGGAGGAAG 
GGA A AAC AGA-3 ' (SEQ ID N°38); brin antisens : 5-TTAAGGCTCA 
ACACGAGGCT-3 1 (SEQ ID N°39) ; gene IGFBP7 : brin sens : 5 '-CTTGAGCTGT 
G AGGTC ATCG-3 ' (SEQ ID N°40); brin antisens : 5-TATAGCTCGG 
CACCTTCACC-3' (SEQ ID N°41); gene SPARC : brin sens : S'-CTGCCTGCCA 
CTG AGGGTTCC-3 1 (SEQ ID N°42) ; brin antisens: 5'-TCCAGGCAGA 
ACAACAAACC ATCC-3' (SEQ ID N°43) ; gene EPB41L3 : brin sens: 5'- 
ACCACCACCA CTACCCACAT-3' (SEQ ID N°44) ; brin antisens : 5'- 
TGGTTTTCCT AACGGTTTGC-3 ' (SEQ ID N°45); gene beta actine : brin sens : 5'- 
TGTTGGCGTA CAGGTCTTTG C-3' (SEQ ID N°46); brin antisens: 5'- 
GCTACGAGCT GCCTGACGG-3' (SEQ ID N°47). L'expression du gene codant la 
P-actine a ete utilisee comme contrdle. Trente cycles de PCR sont ensuite ete realise 
en presence des differentes amorces d'amplification (0,2uM); de dNTPs (0,1 5mM, 
Euromedex) et d'enzyme polymerase (Taq Polymerase ; 0,027U/ul; Perkin Elmer) 
(denaturation 30" a 94 °C, hybridation 1 ' a 60 °C ; polym6risation 1' a 72 °C). 
Les resultats obtenus sont presentes dans le tableau 3 ci dessous, qui montre la 
correlation existant entre les resultats obtenues par l'utilisation d'une biopuce et ceux 
obtenues par RT-PCR. 
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Patients BP 


Patient 


:sMP 


P 




Resultats 
biopuce 


Resultats RT 
PCR 


Resultats 
biopuce 


Resultats 
RT PCR 




SEQ ID N°37 : 
SPARC 


3498 


2,2 


709 


0,87 


0,04 


SEQ ID N°3 
IGFBP7 


4112 


3,7 


691 


1,87 


0,003 


SEQ ID N° 34 
EPB41L3 


6041 


4,2 


986 


1,5 


0,001 


SEQ ID N°25 
PMP22 


9051 


3,8 


2282 


2,75 


0,003 



Tableau 3 



Les resultats de RT-PCR, obtenus a partir de 15 patients BP et 8 patients MP, sont 
exprimes par le rapport de quantification relative entre les ARNm du gene cible et les 

5 ARNm du gene p-actine qui servait de contrSle. Les resultats sont exprimes par la 

moyenne des rapports obtenus pour chacun des groupes de patients. La correlation ^ . 
des resultats obtenus d'une part avec la biopuce et d'autre part avec la technique en ^ 
RT-PCR a ete etablie grace au test de correlation du Tau-B de Kendall. Les patients ^ 
MP presentaient un niveau depression diminuee pour les genes SPARC , IGFBP7 , ^ ; 

10 EPB41 L3, et PMP22, confirmant les resultats presentes dans le tableau 2. 

Les inventeurs ont egalement etudi6 V expression simultanee des 37 genes du tableau 
2 pour obtenir un profil d' expression. Les r6sultats sont pr6sentes dans la figure 1. 
On observe sur ce dendograme deux groupes ayant deux profils d'expression 
15 differents : un premier groupe permettant de classer les patients de bon pronostic 
(BP) et un deuxieme groupe permettant de classer les patients de mauvais pronostic 
(MP). 

Dans Pobjectif de valider le pouvoir de discrimination du profil d' expression de ces 
37 genes, 6 tumeurs supplementaires de patients «test» ont ete analysees sans 
20 connaissance prealable de leur pronostic, et classees comme etant de bon pronostic 
«BP-test» ou de mauvais pronostic «MP-test» en fonction de V analyse de leur 
profil d' expression. Leur bon classement a et6 verifte ensuite seion leurs proprietes 
cliniques : tous les Schantillons « tests » analyses en aveugle par V analyse de 
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r expression de 37 genes avaient ete correctement classes dans le groupe de patients 
de mauvais pronostic «test-MP » ou dans le groupe de patients de bon pronostic 
« test-BP ». Ceci confirme que l'analyse de 1' expression de ces 37 genes est un bon 
outil pour le pronostic du neuroblastoma 

A titre indicatif, l'oncog&ie N-MYC a Sgatement ete utilisee comme outil de 
pronostic. L'utilisation de ce gene mettait en evidence 5 patients de mauvais 
pronostic (MP). Toutefois, 3 patients etaient egalement de mauvais pronostic alors 
qu'aucune augmentation de 1'expression de Poncogdne N-MYC n'ait 6te observee, 
suggerant que l'analyse unique de ce gene n'est pas suffisant pour le pronostic du 
neuroblastome. 

Les inventeurs ont egalement defini des panels de genes plus restreint permettant 
egalement de discriminer les patients de bon et de mauvais pronostic. 
Un premier panel comportait 19 genes qui sont pnSsentes dans le tableau 4. Les 
resultats sont exprimes par le ratio obtenu entre 1'expression moyenne du gene chez 
des patients MP et 1'expression du gene chez des patients BP (ratio MP / BP). 
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Tableau 4 - liste des 19 genes exprim6s differentiellement dans les neuroblatomes de 



patients BP et MP 



SEQ ID N° . 


Description de la sequence 


N° Genbank 


Ratio MP/BP 


1 


Flap structure-specific endonuclease I (FEN1) 


NM 004111 


2,7 


2 


Ubiquitin-conjugating enzyme E2C (UBE2C) 


NM 007019 


2 9 




Insulin-like growth factor binding protein 7 


NM 001553 


0 2 


7 


cDNA FLJ3078 1 fis, clone FEBRA2000874 


AK055343 


0,3 


8 


TIF 1 beta zinc finger protein 


X97548 


1.8 


9 


Likely ortholog of mouse tumor differentially 
expressed 1, like (TDE1L) 


NM 020755 


0,5 


10 


DKFZp434Dl 1 12_sl 434 (synonym: htes3) 
cDNA clone DKFZn434D 1 1 1 2 3* 


AL039831 


0 4 


14 


RuvB-like 2 (E. coli)(RUVBL2) 


NM 006666 


2,1 




RNA binding protein SI, serine-rich domain 
fRNPSl^ tran^rrint variant 1 


NM 006711 


1 6 


20 


Structure specific recognition protein 1 
(SSRP1) 


NM 003146 


2,0 


21 


Collagen, type VI, alpha 3 (COL6A3), 
transcript variant 1 


NM 004369 


0,2 


22 


Small nuclear ribonucleoprotein polypeptides 
BandBl (SNRPB) 


NM 003091 


' <v 

1,7 


25 


Peripheral myelin protein 22 (PMP22), 
transcript variant 1 


Nlyl 000304 


f ■ 

0,3 & 


27 


KIAA0436 mRNA, partial cds 


AB007896 


0,5 


29 


Tripartite motif-conteining 2 (TRIM2) 


NM 015271 


0,4 


31 


Polypyrimidine tract binding protein 1 
(PTBP1), transcript variant 1 


NM 002819 


2,1 


34 


Erythrocyte membrane protein band 4. 1 -like 3 


NM 012307 


0,2 


36 


Fucosidase, alpha-L- 1, tissue (FUCA1) 


NM 000147 


0,2 


37 


Secreted protein, acidic, cysteine-rich 
(osteonectin) (SPARC) 


NM 003118 


0,2 



Les inventeurs ont egalement etudie P expression simultanee de ces 19 genes pour 



obtenir un profil d'expression. Les resultats sont presentes dans la figure 2. On 
5 observe sur ce dendogramme deux groupes ayant deux profil s d' expression 
differents : un premier groupe permettant de classer les patients de bon pronostic 
(BP) et un deuxieme groupe permettant de classer les patients de mauvais pronostic 
(MP). 

Dans Pobjectif de valider le pouvoir de discrimination de ces 19 genes, 6 tumeurs de 
10 patients «test» ont 6t6 analyses sans connaissance pr6alable de leur pronostic. 
Ainsi, les six tumeurs "MP-tesf * et « BP-test » presentees dans la figure 3 sont des 
tumeurs qui ont ete analyses « en aveugle ». Leur bon classement a ete verifte selon 
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leur propriete clinique : tous les patients « MP-test » classes en fonction de leur profil 
d* expression comme patients de mauvais pronostic s'averaient etre des patients de 
mauvais pronostic et tous les patients « BP-test » classes en fonction de leur profil 
d'expression comme patients de bon pronostics s'averaient etre des patients de bon 
5 pronostic. 

D'une fa?on comparable, un deuxieme panel comportait 16 genes tels que presentes 
dans le tableau 5. 

Tableau 5 - liste des 16 genes exprimes differentiellement dans les neuroblatomes de 



patients BP et MP 



SEQ ID N° 


Description de la sequence 


N° Genbank 


1 


Flap structure-specific endonuclease 1 (FEN1) 


NM 004111 


2 


Ubiquitin-conjugating enzyme E2C (UBE2C) 


NM 007019 


3 


Insulin-like growth factor binding protein 7 
(IGFBP7) 


NMJXH553 


7 


cDNA FLJ30781 fis, clone FEBRA2000874 


AK055343 


8 


TIFlbeta zinc finger protein 


X97548 


9 


Likely ortholog of mouse tumor differentially 
expressed 1 5 like (TDE1L) 


NM_020755 


10 


DKFZp434Dl 1 12_sl 434 (synonym: htes3) 
cDNA clone DKFZp434Dl 1 12 V 


AL039831 


20 


Structure specific recognition protein 1 (SSRP1) 


NM 003146 


21 


Collagen, type VI, alpha 3 (COL6A3), transcript 
variant 1 


NM_004369 


22 


Small nuclear ribonucleoprotein polypeptides B 
andBl (SNRPB) 


NM_003091 


25 


Peripheral myelin protein 22 (PMP22), transcript 
variant 1 


NM_000304 


29 


Tripartite motif-containing 2 (TRIM2) 


NM 015271 


31 


Polypyrimidine tract binding protein 1 (PTBP1), 
transcript variant 1 


NMJ)02819 


34 


Erythrocyte membrane protein band 4.1-like 3 
(EPB41L3) 


NMJ 12307 


36 


Fucosidase, alpha-L- 1, tissue (FUCA1) 


NM 000147 


37 


Secreted protein, acidic, cysteine-rich (osteonectin) 
(SPARC) 


NM_003118 



10 Les inventeurs ont 6galement 6tudie V expression simultanee de ces 16 genes pour 
obtenir un profil d'expression. Les resultats sont presentes dans la figure 3. On 
observe sur ce dendogramme deux groupes ayant deux profils d'expression 
differents : un premier groupe permettant de classer les patients de bon pronostic 
(BP) et un deuxieme groupe permettant de classer les patients de mauvais pronostic 

15 (MP). 
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Un troisieme panel comportait 12 genes tels que presentes dans le tableau 6. 
Tableau 6 - liste des 12 genes exprimes differentiellement dans les neuroblatomes de 

patients BP et MP 



SEQ ID N° 


Description de la sequence 


N° Genbank 


2 


Ubiquitin-conjugating enzyme E2C (UBE2C) 


NM 007019 


3 


Insulin-like growth factor binding protein 7 
(IGFBP7) 


NM_001553 


7 


cDNA FLJ30781 fis, clone FEBRA2000874 


AK055343 


8 


TIFlbeta zinc finger protein 


X97548 


10 


DKFZp434D1112 si 434 (synonym: htes3) 
cDNA clone DKFZp434Dl 112 3' 


AL039831 


20 


Structure specific recognition protein 1 (SSRP1) 


NM 003146 


22 


Small nuclear ribonucleoprotein polypeptides B 
andBl (SNRPB) 


NM_003091 


25 


Peripheral myelin protein 22 (PMP22), transcript 
variant 1 


NMJ)00304 


29 


Tripartite motif-containing 2 (TRIM2) 


NM 015271 


31 


Polypyrimidine tract binding protein 1 (PTBP1), 
transcript variant 1 


NM_002819 


34 


Erythrocyte membrane protein band 4.1-like 3 
(EPB41L3) 


NM_012307 


37 


Secreted protein, acidic, cysteine-rich (osteonectin) 
(SPARC) 


NMJ003118 



obtenir un profil d' expression. Les resultats sont presentes dans la figure 4. On* 
observe sur ce dendograme deux groupes ayant deux profils d' expression differents : 
un premier groupe permettant de classer les patients de bon pronostic (BP) et un 
deuxieme groupe permettant de classer les patients de mauvais pronostic (MP). 



Un quatri&ne panel comportait 9 genes tels que presentes dans le tableau 7. 



Tableau 7 - liste des 9 genes exprimes differentien ement dans les neuroblatomes de 



patients BP et MP 


SEQ ID N c 


Description de la sequence 


N° Genbank 


2 


Ubiquitin-coniugating enzyme E2C (UBE2C) 


NM 007019 


3 


Insulin-like growth factor binding protein 7 (IGFBP7) 


NM 001553 


7 


cDNA FLJ30781 fis, clone FEBRA2000874 


AK055343 


8 


TIFlbeta zinc finger protein 


X97548 


10 


DKFZp434Dl 1 12_sl 434 (synonym: htes3) cDNA clone 
DKFZp434D1112 3' 


AL039831 


22 


Small nuclear ribonucleoprotein polypeptides B and B 1 


NM 003091 


25 


Peripheral myelin protein 22 (PMP22), transcript variant 1 


NM 000304 
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29 


Tripartite motif-containing 2 (TRIM2) 


NM 015271 


34 


Erythrocyte membrane protein band 4.1-Iike 3 (EPB41L3) 


NM 012307 



obtenir un profil d'expression. Les resultats sont pr&entes dans la figure 5. On 
observe sur ce dendogramme deux groupes ayant deux profils d'expression 
differents : un premier groupe permettant de classer les patients de bon pronostic 
(BP) et un deuxieme groupe permettant de classer les patients de mauvais pronostic 
(MP). 



Le pouvoir de discrimination de tous ces panels de genes a ete valide avec des 
tumeurs « tests » tels que decrit precedemment : tous les patients « MP-test » classe 
en fonction' de leur profil d'expression comme patients de mauvais pronostic 
s'averaient etre des patients de mauvais pronostic et tous les patients « BP-test » 
classes en fonction de leur profil d'expression comme patients de bon pronostics 
s'averaient etre des patients de bon pronostic. 

Ces resultats demontrent que le pronostic d'un neuroblastome peut £tre determine par 
l'analyse de l'expression de tout ou partie des 37 genes de sequence SEQ ID N°l a 
37. 
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REVENDICATIONS 

L Procede pour le pronostic du neuroblatome chez un patient atteint du 
neuroblastome caracterise en ce qu'il comprend les etapes suivantes : 

a. on extrait du materiel biologique d'un echantillon biologique preleve chez 
le patient, 

b. on met en contact le materiel biologique avec au moins un reactif 
specifique choisi parmi les rSactifs specifiques des genes cibles presentant 
une sequence nucleique ayant Pune quelconque des SEQ ID N° 1 a 37, 
etant entendu que lorsque que le gene cible pr6sente une sequence 
nucleique ayant Tune des SEQ ID N°ll, 17 ou 37, on met en contact le 
materiel biologique avec au moins deux reactifs specifiques choisis parmi 
les reactifs specifiques des genes cibles presentant une sequence 
nucleique ayant Tune quelconque des SEQ ID N° 1 a 37, 

c. on determine Pexpression d'au moins un desdits genes cibles, etant 
entendu que lorsque que le gene cible presente une sequence nucleiquev 
ayant Tune des SEQ ID N°l 1, 17 ou 37, on determine P expression d'au( 
moins deux desdit genes cibles. 

2. Procede pour le pronostic du neuroblatome selon la revendication 1 
caracterise en ce que P echantillon biologique preleve chez le patient est un 
echantillon tissulaire. 

3. Procede selon la revendication 1 ou 2 caracterise en ce que le materiel 
biologique extrait lors de Petape a) comprend des acides nucl&ques. 

4* Procede selon la revendication 3 caracterise en ce que le au moins un reactif 
specifique de Petape b) comprend au moins une sonde d'hybridation 

5. Proc6de selon la revendication 4 caracterise en ce que la au moins une sonde 
d'hybridation est immobilis£e sur un support. 
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6.. Procede selon la revendication 5 caracterise en ce que le support est une 
biopuce. 

7. Procede selon Tune quelconque des revendications 1 a 6 caracterise en ce que 
lors de Petape b) on met en contact le materiel biologique avec au moins 37 
reactifs specifiques choisi parmi les r6actifs specifiques des g&ies cibles 
presentant une sequence nucleique ayant Tune quelconque des SEQ ID N° 1 a 
37 et on determine, lors de Tetape c, I'expression d'au moins 37 desdits genes 
cibles. 

8. Procede selon Tune quelconque des revendications 1 a 6 caracterise en ce que 
lors de P6tape b) on met en contact le materiel biologique avec au moins 19 
reactifs specifiques choisi parmi les r6actifs specifiques des genes cibles 
presentant une sequence nucleique ayant la SEQ ID N°l ; SEQ ID N°2; SEQ 
ID N°3; SEQ ID N°7; SEQ ID N°8; SEQ ID N°9; SEQ ID N°10; SEQ ID 
N°14; SEQ ID N°16; SEQ ID N°20; SEQ ID N°21; SEQ ID N°22; SEQ ID 
N°25; SEQ ID N°27; SEQ ID N°29; SEQ ID N°31; SEQ ID N°34; SEQ ID 
N°36 ou SEQ ID N°37 on determine, lors de V6tape c) Texpression d*au 
moins 19 desdits genes cibles. 
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Figure 4 
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Figure 5 
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SEQUENCE LISTING 

<110> BIOMERIEUX SA / CENTRE LEON BERARD 

<120> Procede pour le pronostic du neuroblastome 

< 1 3 0 > Unknown 

<160> 47 

<170> Patentln version 3.1 

<210> 1 

<211> 2265 

<212> DNA 

<213> Homo sapiens 

<400> 1 



agtcctgcga 


tttcgggtgt agagggagca ggggcctgcg gggacctggt gtgggtggag 


60 


tggggacaag 


cggtggagaa gggtacgcca gggtcgctga gagactctgt tctccctgga 


12 0 


gggactggtt 


gccatgagag cagccgtctg aggggacgca gcctgcacta cgcgccccaa 


180 


gaggctgtgc gtggcgagca ggtcacgtga cgggagcgcg ggctttggaa ggcggctgaa 


240 


cgtcaggcca 


cccgccgcta agctgagaag ggagagcgag cttaggaccg cctgcccggg 


300 


gcaaccccga 


accaagcttt agccgccgag gccgcgtgtc ccaaaggcca gtcatccctc 


360 


ctctgtgttg 


ccatgggaat tcaaggcctg gccaaactaa ttgctgatgt ggcccccagt 


420 


gccatccggg 


agaatgacat caagagctac tttggccgta aggtggccat tgatgcctct 


480 


atgagcattt 


atcagttcct gattgctgtt cgccagggtg gggatgtgct gcagaatgag 


540 


gagggtgaga 


ccaccagcca cctgatgggc atgttctacc gcaccattcg catgatggag 


600 


aacggcatca 


agcccgtgta tgtctttgat ggcaagccgc cacagctcaa gtcaggcgag 


660 


ctggccaaac 


gcagtgagcg gcgggctgag gcagagaagc agctgcagca ggctcaggct 


720 


gctggggccg 


agcaggaggt ggaaaaattc actaagcggc tggtgaaggt cactaagcag 


780 


cacaatgatg 


agtgcaaaca tctgctgagc ctcatgggca tcccttatct tgatgcaccc 


840 


agtgaggcag 


aggccagctg tgctgccctg gtgaaggctg gcaaagtcta tgctgcggct 


900 


accgaggaca 


tggactgcct caccttcggc agccctgtgc taatgcgaca cctgactgcc 


960 


agtgaagcca aaaagctgcc aatccaggaa ttccacctga gccggattct gcaggagctg 


1020 


ggcctgaacc 


aggaacagtt tgtggatctg tgcatcctgc taggcagtga ctactgtgag 


1080 


agtatccggg 


gtattgggcc caagcgggct gtggacctca tccagaagca caagagcatc 


1140 


gaggagatcg 


tgcggcgact tgaccccaac aagtaccctg tgccagaaaa ttggctccac 


1200 


aaggaggctc 


accagctctt cttggaacct gaggtgctgg acccagagtc tgtggagctg 


1260 


aagtggagcg agccaaatga agaagagctg atcaagttca tgtgtggtga aaagcagttc 


1320 



s«* w w 



2 



tctgaggagc 


gaatccgcag tggggtcaag aggctgagta 


agagccgcca 


aggcagcacc 


1380 


cagggccgcc 


tggatgattt cttcaaggtg accggctcac 


tctcttcagc 


taagcgcaag 


1440 


gagccagaac 


ccaagggatc cactaagaag aaggcaaaga 


ctggggcagc 


agggaagttt 


1500 


aaaaggggaa 


aataaatgtg tttccccatt atacctcctt 


caccccagaa 


tatttgccgt 


1560 


cttgtaccct 


taagagctac agctagagaa accttcacgg 


ggtggagaga ggattctaag 


1620 


gcttttctag cgtgaccctt ttcagtagtg ctagtccctt 


ttttacttga 


tcttaatggc 


1680 


aagaaggcca 


cagaggtact tttccttttt tagctcagga 


aaatatgtca ggctcaaacc 


1740 


acttctcagg 


cagtttaatg gacactaagt ccattgttac 


atgaaagtga tagatagcaa 


1800 


caagttttgg agaagagaga gggagataaa agggggagac 


aaaagatgta 


cagaaatgat 


1860 


ttcctggctg 


gccaactggt ggccagtggg aggtgatggt 


ggacctagac 


tgtgcttttc 


1920 


tgtcttgttc 


agccttgacc caccttgaga gagagccacc 


aggaaggcgc 


atcttagcag 


1980 


atgggaggaa 


ctgctgagag aagatgggca gaaagctgga 


gcccctggag 


ttggctgtgt 


2040 


ctgtgtttgt 


gactgattac tggctgtgtc ttgggtgggc 


agaaactcga 


acttgctatg 


2100 


taatttgtgt 


ctagttattc agaggagtaa gatggtgatg 


ttcacctggc 


aatcagctga 


2160 


gttgagactt 


tggaataaga cactggtttt catgcgctgt 


ttttgtttta 


aagttatgaa 


2220 


gaaaaaagtc 


aataaaattc taaaagtaaa . aaaaaaaaaa 


aaaaa 




2265 



<210> 2 

<211> 783 

<212> DNA 

<213> Homo sapiens 

<400> 2 



ggcacgagcg 


agttcctgtc 


tctctgccaa 


cgccgcccgg 


atggcttccc 


aaaaccgcga 


60 


cccagccgcc 


actagcgtcg 


ccgccgcccg 


taaaggagct 


gagccgagcg 


ggggcgccgc 


120 


ccggggtccg 


gtgggcaaaa ggctacagca 


ggagctgatg 


accctcatga 


tgtctggcga 


180 


taaagggatt 


tctgccttcc 


ctgaatcaga 


caaccttttc 


aaatgggtag ggaccatcca 


240 


tggagcagct 


ggaacagtat 


atgaagacct 


gaggtataag 


ctctcgctag 


agttccccag 


300 


tggctaccct 


tacaatgcgc 


ccacagtgaa gttcctcacg 


ccctgctatc 


accccaacgt 


360 


ggacacccag 


ggtaacatat 


gcctggacat 


cctgaaggaa 


aagtggtctg 


ccctgtatga 


420 


tgtcaggacc 


attctgctct 


ccatccagag 


ccttctagga 


gaacccaaca 


ttgatagtcc 


480 


cttgaacaca 


catgctgccg agctctggaa 


aaaccccaca 


gcttttaaga 


agtacctgca 


540 


agaaacctac 


tcaaagcagg 


tcaccagcca 


ggagccctga 


cccaggctgc 


ccagcctgtc 


600 


cttgtgtcgt 


ctttttaatt 


tttccttaga 


tggtctgtcc 


tttttgtgat 


ttctgtatag 


660 



3 



gactctttat 


cttgagctgt 


ggtatttttg 


ttttgttttt 


gtcttttaaa 


ttaagcctcg 


720 


gttgagccct 


tgtatattaa 


ataaatgcat 


"tttVgtcctt 


ttttaaaaaa 


aaaaaaaaaa 


780 


aaa 
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<210> 3 

<211> 1124 

<212> DNA 

<213> Homo sapiens 












<400> 3 

gccgctgcca 


ccgcaccccg ccatggagcg 


gccgtcgctg 


cgcgccctgc 


tcctcggcgc 


60 


cgctgggctg 


ctgctcctgc 


tcctgcccct 


ctcctcttcc 


tcctcttcgg 


acacctgcgg 


120 


cccctgcgag 


ccggcctcct 


gcccgcccct 


gcccccgctg 


ggctgcctgc 


tgggcgagac 


180 


ccgcgacgcg 


tgcggctgct gccctatgtg 


cgcccgcggc 


gagggcgagc 


cgtgcggggg 


240 


tggcggcgcc 


ggcagggggt 


actgcgcgcc 


gggcatggag 


tgcgtgaaga 


gccgcaagag 


300 


gcggaagggt 


aaagccgggg 


cagcagccgg 


cggtccgggt 


gtaagcggcg 


tgtgcgtgtg 


360 


caagagccgc 


tacccggtgt 


gcggcagcga 


cggcaccacc 


tacccgagcg gctgccagct 


420 


gcgcgccgcc 


agccagaggg 


ccgagagccg 


cggggagaag 


gccatcaccc 


aggtcagcaa 


480 


gggcacctgc 


gagcaaggtc 


cttccatagt 


gacgcccccc 


aaggacatct 


ggaatgtcac 


540 


tggtgcccag 


gtgtacttga 


gctgtgaggt 


catcggaatc 


ccgacacctg 


tcctcatctg 


600 


gaacaaggta 


aaaaggggtc 


actatggagt 


tcaaaggaca 


gaactcctgc 


ctggtgaccg 


660 


ggacaacctg gccattcaga 


cccggggtgg 


cccagaaaag 


catgaagtaa 


ctggctgggt 


720 


gctggtatct 


cctctaagta 


aggaagatgc 


tggagaatat 


gagtgccatg 


catccaattc 


780 


ccaaggacag 


gcttcagcat 


cagcaaaaat 


tacagtggtt 


gatgccttac 


atgaaatacc 


840 


agtgaaaaaa 


ggtgaaggtg 


ccgagctata 


aacctccaga 


atattattag 


tctgcatggt 


900 


taaaagtagt 


catggataac 


tacattacct 


gttcttgcct 


aataagtttc 


ttttaatcca 


960 


atccactaac 


actttagtta 


tattcactgg 


ttttacacag 


agaaatacaa 


aataaagatc 


1020 


acacatcaag actatctaca aaaatttatt 


atatatttac 


agaagaaaag 


catgcatatc 


1080 


attaaacaaa 


taaaatactt 


tttatcacaa 


aaaaaaaaaa 


aaaa 
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<210> 4 

<211> 5084 

<212> DNA 

<213> Homo sapiens 












<400> 4 
agcaccacgg 


cagcaggagg 


tttcggctaa 


gttggaggta 


ctggccacga 


ctgcatgccc 


60 



4 



gcgcccgcca ggtgatacct ccgccggtga cccaggggct 


ctgcgacaca aggagtctgc 


120 


atgtctaagt gctagacatg ctcagctttg tggatacgcg 


gactttgttg 


ctgcttgcag 


180 


taaccttatg cctagcaaca tgccaatctt tacaagagga 


aactgtaaga 


aagggcccag 


240 


ccggagatag aggaccacgt ggagaaaggg gtccaccagg 


ccccccaggc 


agagatggtg 


300 


aagatggtcc cacaggccct cctggtccac ctggtcctcc 


tggcccccct 


ggtctcggtg 


360 


ggaactttgc tgctcagtat gatggaaaag gagttggact 


tggccctgga ccaatgggct 


420 


taatgggacc tagaggccca cctggtgcag ctggagcccc 


aggccctcaa 


ggttt ccaag 


480 


gacctgctgg tgagcctggt gaacctggtc aaactggtcc 


tgcaggtgct 


cgtggtccag 


540 


ctggccctcc tggcaaggct ggtgaagatg gtcaccctgg 


aaaacccgga 


cgacctggtg 


600 


agagaggagt tgttggacca cagggtgctc gtggtttccc 


tggaactcct 


ggacttcctg 


660 


gcttcaaagg cattagggga cacaatggtc tggatggatt 


gaagggacag 


cccggtgctc 


720 


ctggtgtgaa gggtgaacct ggtgcccctg gtgaaaatgg 


aactccaggt 


caaacaggag 


780 


cccgtgggct tcctggtgag agaggacgtg ttggtgcccc 


tggcccagct 


ggtgcccgtg 


84 0. 


gcagtgatgg aagtgtgggt cccgtgggtc ctgctggtcc 


cattgggtct 


gctggccctc 


900 


caggcttccc aggtgcccct ggccccaagg gtgaaattgg agctgttggt 


aacgctggtc 


960, 


ctgctggtcc cgccggtccc cgtggtgaag tgggtcttcc 


aggcctctcc 


ggccccgttg 


1020 


gacctcctgg taatcctgga gcaaacggcc ttactggtgc 


caagggtgct 


gctggccttc 


1080 


ccggcgttgc tggggctccc ggcctccctg gaccccgcgg 


tattcctggc 


cctgttggtg 


1140 


ctgccggtgc tactggtgcc agaggacttg ttggtgagcc 


tggtccagct 


ggctccaaag 


1200 


gagagagcgg taacaagggt gagcccggct ctgctgggcc 


ccaaggtcct 


cctggtccca 


1260 


gtggtgaaga aggaaagaga ggccctaatg gggaagctgg 


atctgccggc 


cctccaggac 


1320 


ctcctgggct gagaggtagt cctggttctc gtggtcttcc 


tggagctgat 


ggcagagctg 


1380 


gcgtcatggg ccctcctggt agtcgtggtg caagtggccc 


tgctggagtc 


cgaggaccta 


1440 


atggagatgc tggtcgccct ggggagcctg gtctcatggg 


acccagaggt 


cttcctggtt 


1500 


cccctggaaa tatcggcccc gctggaaaag aaggtcctgt 


cggcctccct 


ggcatcgacg 


1560 


gcaggcctgg cccaattggc ccagctggag caagaggaga 


gcctggcaac 


attggattcc 


1620 


ctggacccaa aggccccact ggtgatcctg gcaaaaacgg 


tgataaaggt 


catgctggtc 


1680 


ttgctggtgc tcggggtgct ccaggtcctg atggaaacaa 


tggtgctcag 


ggacctcctg 


1740 


gaccacaggg tgttcaaggt ggaaaaggtg aacagggtcc 


cgctggtcct 


ccaggcttcc 


1800 


agggtctgcc tggcccctca ggtcccgctg gtgaagttgg 


caaaccagga 


gaaaggggtc 


1860 


tccatggtga gtttggtctc cctggtcctg ctggtccaag 


aggggaacgc 


ggtcccccag 


1920 
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gtgagagtgg tgctgccggt cctactggtc ctattggaag ccgaggtcct tctggacccc 198 0 
cagggcctga tggaaacaag ggtgaacctg gtgtggttgg tgctgtgggc actgctggtc* 2040 
catctggtcc tagtggactc ccaggagaga ggggtgctgc tggcatacct ggaggcaagg 2100 
gagaaaaggg tgaacctggt ctcagaggtg aaattggtaa ccctggcaga gatggtgctc 2160 
gtggtgctca tggtgctgta ggtgcccctg gtcctgctgg agccacaggt gaccggggcg 2220 
aagctggggc tgctggtcct gctggtcctg ctggtcctcg gggaagccct ggtgaacgtg 2280 
gcgaggtcgg tcctgctggc cccaacggat ttgctggtcc ggctggtgct gctggtcaac 2340 
cgggtgctaa aggagaaaga ggagccaaag ggcctaaggg tgaaaacggt gttgttggtc 2400 
ccacaggccc cgttggagct gctggcccag ctggtccaaa tggtcccccc ggtcctgctg 2460 
gaagtcgtgg tgatggaggc ccccctggta tgactggttt ccctggtgct gctggacgga 2520 
ctggtccccc aggaccctct ggtatttctg gccctcctgg tccccctggt cctgctggga 2580 
aagaagggct tcgtggtcct cgtggtgacc aaggtccagt tggccgaact ggagaagtag 2640 

gtgcagttgg tccccctggc ttcgctggtg agaagggtcc ctctggagag gctggtactg 2700 

ctggacctcc tggcactcca ggtcctcagg gtcttcttgg tgctcctggt attctgggtc 2760 

tccctggctc gagaggtgaa cgtggtctac ctggtgttgc tggtgctgtg ggtgaacctg 2 820 

gtcctcttgg cattgccggc cctcctgggg cccgtggtcc tcctggtgct gtgggtagtc 2 880 

ctggagtcaa cggtgctcct ggtgaagctg gtcgtgatgg caaccctggg aacgatggtc 2940 

ccccaggtcg cgatggtcaa cccggacaca agggagagcg cggttaccct ggcaatattg 3000 

gtcccgttgg tgctgcaggt gcacctggtc ctcatggccc cgtgggtcct gctggcaaac 3 060 

atggaaaccg tggtgaaact ggtccttctg gtcctgttgg tcctgctggt gctgttggcc 312 0 

caagaggtcc tagtggccca caaggcattc gtggcgataa gggagagccc ggtgaaaagg 3180 

ggcccagagg tcttcctggc ttaaagggac acaatggatt gcaaggtctg cctggtatcg 324 0 

ctggt caeca tggtgatcaa ggtgctcctg gctccgtggg tcctgctggt cctaggggcc 33 00 

ctgctggtcc ttctggccct gctggaaaag atggtcgcac tggacatcct ggtacggttg 33 60 

gaectgetgg cattcgaggc cctcagggtc accaaggccc tgctggcccc cctggtcccc 3 420 

ctggccctcc tggacctcca ggtgtaagcg gtggtggtta tgactttggt tacgatggag 3 480 

acttctacag ggctgaccag cctcgctcag caccttctct cagacccaag gactatgaag 3 54 0 

ttgatgetae tctgaagtct ctcaacaacc agattgagac ccttcttact cctgaaggct 3 600 

ctagaaagaa cccagctcgc acatgeegtg acttgagact cagccaccca gagtggagca 3 660 

gtggttacta ctggattgac cctaaccaag gatgeactat ggatgetate aaagtatact 3 720 
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gtgatttctc tactggcgaa acctgtatcc gggcccaacc tgaaaacatc ccagccaaga 3 780 

actggtatag gagctccaag gacaagaaac acgtctggct aggagaaact atcaatgctg 3 840 

gcagccagtt tgaatataat gtagaaggag tgacttccaa ggaaatggct acccaacttg 3 9 00 

ccttcatgcg cctgctggcc aactatgcct ctcagaacat cacctaccac tgcaagaaca 3 960 

gcattgcata catggatgag gagactggca acctgaaaaa ggctgtcatt ctacagggct 4020 

ctaatgatgt tgaacttgtt gctgagggca acagcaggtt cacttacact gttcttgtag 4 08 0 

atggctgctc taaaaagaca aatgaatggg gaaagacaat cattgaatac aaaacaaata 414 0 

agccatcacg cctgcccttc cttgatattg cacctttgga catcggtggt gctgaccatg 42 00 

aattctttgt ggacattggc ccagtctgtt tcaaataaat gaactcaatc taaattaaaa 42 60 

aagaaagaaa tttgaaaaaa ctttctcttt gccatttctt cttcttcttt tttaactgaa 4320 

agctgaatcc ttccatttct tctgcacatc tacttgctta aattgtgggc aaaagagaaa 43 80 

aagaaggatt gatcagagca ttgtgcaata cagtttcatt aactccttcc cccgctcccc 4440 

caaaaatttg aatttttttt tcaacactct tacacctgtt atggaaaatg tcaacctttg 4500. 

taagaaaacc aaaataaaaa ttgaaaaata aaaaccataa acatttgcac cacttgtggc 4560 

ttttgaatat cttccacaga gggaagttta aaacccaaac ttccaaaggt ttaaactacc 462 0 



tcaaaacact ttcccatgag tgtgatccac attgttaggt gctgacctag acagagatga 4680 . 

f -. ' 

actgaggtcc ttgtfcttgtt ttgttcataa tacaaaggtg ctaattaata gtatttcaga 474 0 , 

tacttgaaga atgttgatgg tgctagaaga atttgagaag aaatactcct gtattgagtt 480 0 

gtatcgtgtg gtgtattttt taaaaaattt gatttagcat tcatattttc catcttattc 4860 

ccaattaaaa gtatgcagat tatttgccca aagttgtcct cttcttcaga ttcagcattt 4920 

gttctttgcc agtctcattt tcatcttctt ccatggttcc acagaagctt tgtttcttgg 4 980 

gcaagcagaa aaattaaatt gtacctattt tgtatatgtg agatgtttaa ataaafctgtg 5040 

aaaaaaatga aataaagcat gtttggtttt ccaaaagaac atat 5084 

<210> 5 

<211> 2518 

<212> DNA 

<213> Homo sapiens 

<400> 5* 

cttcgggtgt acgtgctccg ggatcttcag cacccgcggc cgccatcgcc gtcgcttggc 60 

ttcttctgga ctcatctgcg ccacttgtcc gcttcacact ccgccgccat catggtgaag 120 

ctcgcgaagg caggtaaaaa tcaaggtgac cccaagaaaa tggctcctcc tccaaaggag 18 0 

gtagaagaag atagtgaaga tgaggaaatg tcagaagatg aagaagatga tagcagtgga 24 0 
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gaagaggtcg tcatacctca gaagaaaggc aagaaggctg ctgcaacctc agcaaagaag 300 

. 9 . t ?? tc : 9 . ttt . . c . cc . caaca ^ a ■* a Sft t 95* 9ttgccacac . cagccaagaa agcag.ctgtq .3.50 

actccaggca aaaaggcagc agcaacacct gccaagaaga cagttacacc agccaaagca 420 

gttaccacac ctggcaagaa gggagccaca ccaggcaaag cattggtagc aactcctggt 480 

aagaagggtg ctgccatccc agccaagggg gcaaagaatg gcaagaatgc caagaaggaa 540 

gacagtgatg aagaggagga tgatgacagt gaggaggatg aggaggatga cgaggacgag 600 

gatgaggatg aagatgaaat tgaaccagca gcgatgaaag cagcagctgc tgcccctgcc 660 

tcagaggatg aggacgatga ggatgacgaa gatgatgagg atgacgatga cgatgaggaa 720 

gatgactctg aagaagaagc tatggagact acaccagcca aaggaaagaa agctgcaaaa 780 

gttgttcctg tgaaagccaa gaacgtggct gaggatgaag atgaagaaga ggatgatgag 840 

gacgaggatg acgacgacga cgaagatgat gaagatgatg atgatgaaga tgatgaggag 900 

gaggaagaag aggaggagga agagcctgtc aaagaagcac ctggaaaacg aaagaaggaa 950 

atggccaaac agaaagcagc tcctgaagcc aagaaacaga aagtggaagg cacagaaccg 1020 

actacggctt tcaatctctt tgttggaaac ctaaacttta acaaatctgc tcctgaatta 1080 

aaaactggta tcagcgatgt ttttgctaaa aatgatcttg ctgttgtgga tgtcagaatt 1140 

ggtatgacta ggaaatttgg ttatgtggat tttgaatctg ctgaagacct ggagaaagcg 1200 

ttggaactca ctggtttgaa agtctttggc aatgaaatta aactagagaa accaaaagga 1260 

aaagacagta agaaagagcg agatgcgaga acacttttgg ctaaaaatct cccttacaaa 13 20 

gtcactcagg atgaattgaa agaagtgttt gaagatgctg cggagatcag attagtcagc 1380 

aaggatggga aaagtaaagg gattgcttat attgaattta agacagaagc tgatgcagag 1440 

aaaacctttg aagaaaagca gggaacagag atcgatgggc gatctatttc cctgtactat 1500 

actggagaga aaggtcaaaa tcaagactat agaggtggaa agaatagcac ttggagtggt 1560 

gaatcaaaaa ctctggtttt aagcaacctc tcctacagtg caacagaaga aactcttcag 1620 

gaagtatttg agaaagcaac ttttatcaaa gtaccccaga accaaaatgg caaatctaaa 1680 

gggtatgcat ttatagagtt tgcttcattc gaagacgcta aagaagcttt aaattcctgt 1740 

aataaaaggg aaattgaggg cagagcaatc aggctggagt tgcaaggacc caggggatca 18 00 

cctaatgcca gaagccagcc atccaaaact ctgtttgtca aaggcctgtc tgaggatacc 1860 

actgaagaga cattaaagga gtcatttgac ggctccgttc gggcaaggat agttactgac 1920 

cgggaaactg ggtcctccaa agggtttggt tttgtagact tcaacagtga ggaggatgcc 1980 

aaggaggcca tggaagacgg tgaaattgat ggaaataaag ttaccttgga ctgggccaaa 2040 

cctaagggtg aaggtggctt cgggggtcgt ggtggaggca gaggcggctt tggaggacga 2100 
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ggtggtggta 


gaggaggccg 


aggaggattt 


ggtggcagag 


gccggggagg 


ctttggaggg 


2160 


cgaggaggct 


tccgaggagg 


cagaggagga 


Srgaggtgacc 


acaagccaca 


aggaaagaag 


2220 


acgaagtttg aatagcttct 


gtccctctgc 


tttccctttt 


ccatttgaaa 


gaaaggactc 


2280 


tggggttttt 


actgttacct 


gatcaatgac 


agagccttct 


gaggacattc 


caagacagta 


2340 


tacagtcctg 


tggtctcctt 


ggaaatccgt 


ctagttaaca 


tttcaagggc 


aataccgtgt 


2400 


tggttttgac 


tggatattca 


tataaacttfc 


ttaaagagtt 


gagtgataga 


gctaaccctt 


2460 


atctgtaagt 


tttgaattta 


tattgtttca 


tcccatgtac 


aaaaccattt 


tttcctac 


2518 



<210> 6 

<211> 3677 

<212> DNA 

<213> Homo sapiens 

<400> 6 



cgcctgcccg 


cccgcccgct 


cgcccccggt 


ccggactcct 


cctcctcctc 


ttctcgccat 


60 


tgcagttgga 


cccagcagcc 


cggcgcgcac 


cgcgtggctt 


ttgggggcag 


accccggcgg 


120 


gctgtggcag 


gagggcggcg 


gcggcggctg 


cggtcgaaga 


aggggacgcc 


gacaagagtt 


180 


gaagtattga 


taacaccaag 


gaactctatc 


acaatttgaa 


aagataagca 


aaagtttgat 


240 


ttccagacac 


tacagaagaa 


gtaaaaatgc 


gtccaatgcg 


aatttttgtg 


aafcgatgacc 


300 


gccatgtgat 


ggcaaagcat 


tcttccgttt 


atccaacaca 


agaggagctg 


gaggcagtcc 


360 


agaacatggt 


gtcccacacg 


gagcgggcgc 


tcaaagctgt 


gtccgactgg 


atagacgagc 


420 


aggaaaaggg 


tagcagcgag 


caggcagagt 


ccgataacat 


ggatgtgccc 


ccagaggacg 


480 


acagtaaaga 


aggggctggg 


gaacagaaga 


cggagcacat 


gaccagaacc 


ctgcggggag 


540 


tgatgcgggt 


gggcctggtg 


gcaaagggcc 


tcctactcaa 


gggggacttg 


gatctggagc 


600 


tggtgctgct 


gtgtaaggag 


aagcccacaa 


ccgccctcct 


ggacaaggtg 


gccgacaacc 


660 


tggccatcca 


gcttgctgct 


gtaacagaag 


acaagtacga 


aatactgcaa 


tctgtcgacg 


720 


atgctgcgat 


tgtgataaaa 


aacacaaaag 


agcctccatt 


gtccctgacc 


atccacctga 


780 


catcccctgt 


tgtcagagaa 


gaaatggaga 


aagtattagc 


tggagaaacg 


ctatcagtca 


340 


acgacccccc 


ggacgttctg 


gacaggcaga 


aatgccttgc 


tgccttggcg 


tccctccgac 


900 


acgccaagtg 


gttccaggcc 


agagccaacg 


ggctgaagtc 


ttgtgtcatt 


gtgatccggg 


960 


tcttgaggga 


cctgtgcact 


cgcgtgccca 


cctggggtcc 


cctccgaggc 


tggcctctcg 


1020 


agctcctgtg 


tgagaaatcc 


attggcacgg 


ccaacagacc 


gatgggtgct 


ggcgaggccc 


1080 


tgcggagagt 


gctggagtgc 


ctggcgtcgg 


gcatcgtgat 


gccagatggt 


tctggcattt 


1140 


atgacccttg 


tgaaaaagaa 


gccactgatg 


ctattgggca 


tctagacaga 


cagcaacggg 


1200 
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aagatatcac acagagtgcg cagcacgcac 


tgcggctcgc 


tgccttcggc 


cagctccata 


1260 


aagtcctagg ' catggaccct ctgccttcca agatgcccaa" gaaaccaaag aatgaaaa'cc" 


1*3 20 - 


cagtggacta caccgttcag atcccaccaa gcaccaccta 


tgccattacg 


cccatgaaac 


1380 


gcccaatgga ggaggacggg gaggagaagt 


cgcccagcaa 


aaagaagaag 


aagattcaga 


1440 


agaaagagga gaaggcagag cccccccagg 


ctatgaatgc 


cctgatgcgg 


ttgaaccagc 


1500 


tgaagccagg gctgcagtac aagctggtgt 


cccagactgg 


gcccgtccat 


gcccccatct 


1560 


ttaccatgtc tgtggaggtt gatggcaatt 


cattcgaggc 


ctctgggccc 


tccaaaaaga 


1620 


cggccaagct gcacgtggcc gttaaggtgt 


tacaggacat 


gggcttgccg acgggtgctg 


1680 


aaggcaggga ctcgagcaag ggggaggact 


cggctgagga 


gaccgaggcg 


aagccagcag 


1740 


tggtggcccc tgccccagtg gtagaagctg 


tctccacccc 


tagtgcggcc 


tttccctcag 


1800 


atgccactgc cgagcagggg ccgatcctga 


caaagcacgg 


caagaaccca 


gtcatggagc 


1860 


tgaacgagaa gaggcgtggg ctcaagtacg 


agctcatctc 


cgagaccggg 


ggcagccacg 


1920 


acaagcgctt cgtcatggag gtcgaagtgg atggacagaa gttccaaggt gctggttcca 


1980 


acaaaaaggt ggcgaaggcc tacgctgctc 


ttgctgccct 


agaaaagctt 


fctccctgaca 


2040 


cccctctcgc ccttgatgcc aacaaaaaga 


agagagcccc 


agtacccgtc 


agagggggac 


2100 


cgaaatttgc tgctaagcca cataaccctg gcttcggcat 


gggaggcccc 


atgcacaacg 


2160 


aagtgccccc accccccaac cttcgagggc 


ggggaagagg 


cgggagcatc 


cggggacgag 


2220 


ggcgcgggcg aggatttggt ggcgccaacc atggaggcta catgaatgcc ggtgctgggt 


2280 


atggaagcta tgggtacgga ggcaactcgg 


cgacagcagg 


ctacagtgac 


tttttcacag 


2340 


actgctacgg ctatcatgat tttgggtctt 


cctagagcgt 


cfcaaaagtat 


tgcacacaaa 


2400 


atcaactttt tactccaatt tcctccaact 


ccaaaaccca 


aagtgtccgt 


gctgtgtccc 


2460 


tgtgcttcac tgggtttctc aaccgtggct 


tttcaccgca 


gcttgtctga 


aactcttagc 


2520 


ctgcagaatt taagacaatg gcagttttta 


tcgtgatttg 


cctttgaact 


tggtcctatt 


2580 


gaagttcaca ataagtggaa aacaattttt 


tcagagaatg 


tatttttgtg 


cagaattgca 


2640 


cagaattcta gagacagcgt tgttcggcat 


caaggcaaaa gcccaccttt gctttttatg 


2700 


gaaagcatta ctttatttaa agagacagac 


aatgacgcat 


tttaatctac 


ctttgtctta 


2760 


atttacagca ggttttgtat gaatttttaa 


ccttttaaca 


aactcccaaa 


tctggttgat 


2820 


gcctttgaca gtgatgaaaa cgatttcacc 


acatctgaat 


ccagagaaac 


cggctttttt 


2880 


tcttattgcg agcatgttaa aacgttggga acatgtgggg 


aattgtatat 


tgcgctgaat 


2940 


taacttctcc cgcctcttgt aatgctctgg tgggttcttg tttgggaatg cgatattttg 


3000 
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tggctggttt agctagagag tgaactctca aaggtatcaa aactgtgctt ccattattag 3 060 

tgcaagaaac agacaggctt taaggggtag atgacgtgaa attttgcaag tcttaattac 312 0 

agctgcagat gcatgggatt ctggattttt ttgttgcttt ttagtttaat gggactttaa 3180 

aagtaattga ggagaaagaa ccgtgatgtt ccctgtttct ccagtaaagg actggctttt 324 0 

gcttgggcag aggtggtgct gctgggtgtg cagctgccac agactccaaa ggcgtagaag 33 00 

tttgtgccaa cacacggagt cattctggct ctctgctgag gcccctgttt tctggcaggt 33 60 

gccctccttg gaaactggtt ttggctctga tcagcggttc tttttgcagc aaagcctgca 3420 

tctgtgttga cttgcaagat tttgcgttta ttcaggcaaa aactggtcaa aatggttact 34 8 0 

acatgatttg ttcccagagg tttgaaacat tcagtgaaac tttttaaaac tttgattgca 354 0 

tgatgtattt tttttttaga aagttattgt ttgagaataa tgtcttttta taccaggaaa 3 600 

atagttatcc tgaatgacgt tgaaaactcc ccctcccctt tatttttttt taatcaatac 3 660 

atgtgaaagt aacaagc 3 677 

<210> 7 

<211> 2901 

<212> DNA 

<213> Homo sapiens 

<400> 7 

ttgaaatcag gaaatcaggc cgggcgcagt ggctcatgcc tgtaagccca gcactttggg 60 # A 

aggcggaggc gggtggatcc attgaggtca ggagctcaag accagcctgg tcaacatggt 120 ^. 

gaaaccccgt ctctactaaa aatacaaaaa aaaaattagc tgggcgtgtt ggcgggagcc 180 ^ 

tgtagtccca gctacacggg aggctaaggt gggagaattg cttgaacccg ggaggcggag 240,. 

gttgcagtga gctgagattg caccattgca ctccagcctg ggcgacagag caagactctc 3 00 

tcaaaaaaaa aaaaaaagaa agaaagaaat cagaaaatcg accacagtgg tagccacctg 3 60 

gcctaatgct gtgtttttgt acctgacagg ggtcactcat tttaggcaca actccttcat 420 

tctttgtgaa attagtgagt ttccttctac ccgtcaccag attcaatatg ttctattaat 480 

acaccgataa ccacagggga agggcacttg tcgctctccc acctggttac cacagtctcc 54 0 

atgggtcttt tgccgtgacc acaaataaag gaaacactca tcactagtat ctaagtcggg 600 

ctttacagta actatgcacc ttctgtgtgc ttcacctcac tctctacttc aaacagccca 660 

tggagggagg tattattata ctccttatgt tgacagtgaa gaatctgagg cccagagagg 72 0 

ttggggactt gagtaaagtc acacagccct gagaggcagg accagggttc cattcctgct 780 

ctatccagtt ccaagccctt gtgttttcca ttatgtttag tgcctctttg ctaacagcaa 84 0 

catctgcaag atttgtgttg gttttgatgg agaactctag ctcatccaca tgctagtgcc 900 



11 





aggggccacc 


tcagcaggtg ggttctgaat 


geagecaagg ctgtccccgc 


960 


aa t cracr t crao 


actcgctcca 


actgcccgcc ctcagagcag gtgcctaagt cctccctggc 


1020 


actQcrcacrcrc 


cttacctcac 


attgetaaat taaagcaatg 


caattcctct tgggtaagag 


1080 


Qaattcctcc 


ttctttacta actgatcccc agcaaggaaa taaaatgtta ggctttaaaa 


1140 


atccr*t*ar , t" f~ 

w >»- V' V* CTV_» l_ 


tgtcatatca 


gactatattc taaaactata 


tttgagcgaa acctgtcatt 


1200 


exeat" clr pi t* f- 


tcaaatatac 


agaatctcct taagagctgt 


tgccttattt ttttgtaaag 


1260 




atcaaatggg 


gagaaatggt ggcacctcca 


gacaccctga aactacacac 


1320 


d. l^- «. U- s 


ctgctcagct tetgetcagg agttctgtga gctatgggaa ggccattggt 


1380 




acttttactt 


tcatcttcct ctgctgtaga 


gecatttaat gttattgtca 


1440 


t-a. L-y i_y v_ l~y 


gtgaggtaaa ggtgggtccg ggtgccttcc 


caggggttag aggatgttca 


1500 


w-ayy y c cgax. 


ttcagcagga gttcagaggg cttatgatgg atggtgagag atttgacaac 


1560 




catgtgctct 


gaccctctcc tgggcattgg 


ttcctgctgg tacegggegg 


1620 


*-» v-»c*y clv_> — . l_ 


caaataggtt gctttcaaaa gagctttcag gcacttattg agaattaatg 


1680 


U« l^-CLCLCHwCty CL 


cataatagee 


tagatgaact cccaagagat 


ctattaaatc ttgtgggctg 


1740 


del. L-ddd UaLC 


tcgtgcagga ctgtgcaaca gtageccaga gcatcctgcc tgtgggcatc 


1800 


f% » — w g~*m 

LdCCLCCCay 


gtgagggcag tgggaagctg gcccgacggc agecagaact tgtttctcac 


1860 


f*" 1 f*\ ««- | — k y«— 


caacccccca 


cccaactctg ggccccaggc 


acacgaagca caagtctcag 


1920 


<Trtrra nt~* ?a +" «»■» 

yyyaccautc 


ccacattggg 


ggatcctgag ggagcccatc 


accgcctctt gcatacaact 


. 1980 


gtccaccayg 


aggcacgccc 


agtgtgggag agatgtatgg 


tcttgccttc cacctgtaaa 


.2040 


aactgeacat 


atgeaageca 


tttgeactet ggaactgeat 


gccgtgaaaa ctcctaatgg 


2100 


tgtggaact t 


agtttgaatt 


tgaaatcacg ccgcatgcac 


aaagggacag gcccaggccc 


2160 


gacctcaggt 


catccgcccg 


ctggctgcag agcatccctg 


ggagecaagg cgaggcccgt 


2220 


yyayectgag 


ctttgtgtag 


ctcgagcttt gtgtagctcg 


tgcacttatt atgcaccacc 


2280 


UtLLL LUdy L. 


caccactcct 


cttcctccgc catcctcatt 


tatactgatt gcacaccccc 


2340 




acaatgtcct 


tattatgatg accatctcgt 


agtggtacat tccattccta 


2400 


t-cuaaggcaa 


gcccaaagcc 


cacttttgga ttttctcgac 


tgtccgagaa aagttgtgta 


2460 


a yCyCCCyCCf 


ttcttctggg tttggctaga tagggttgtg tccctctatg gaatggagag 


2520 


tgatgtgggc 


aagggtgtca 


ttttctcgea caatacaact 


cactgaggat gcttctgtag 


2580 


aagtgagaaa 


cacgatgagt 


acattcagaa ttacaataac 


tcactctcac tgggtaactt 


2640 


ctcatgatag 


atttgtatga 


teaataeggg tctattttta 


tgtcaactga acactgtagg 


2700 


gtaccttcca 


gtctttttca 


agattgttaa attgagacaa gtaattgaat aatttgtcct 


2760 



i er depot 
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atttttattt taaaaaaagt gaatggactg aaatgttaaa tgtgaatgta catttcttaa 2820 

ttgcaatttt tctactgagt gtttgcacta tactttctgg aatcttattt aacaaaaata 288 0 

aagggaaaaa attgcttgac t 2901 

<210> 8 
<211> 3056 
<212> DNA 



<213> Homo 


sapiens 








<400> 8 
ctc CTgaq-cacra 


ccggcggcgg aggccgggcc gcggagccag 


gagtgactag 


cagcagttgg 


60 


ccorfcorcccrta 


gcagcgtccc gcgcgcggcg ggcagcggcc 


caggaggcgc 


gtggtgcggg 


120 


1 1 1 ccrcr ccrcr c 

w w w w ^3 w v 


ggctgaggaa gaagcgcggg cggcgccttc 


gggaggcgag 


caggcagcag 


180 


1 1 crcr c ccr t cr c 


cgtagcagcg tcccgcgcgc ggcgggcagc 


ggcccaggag 


gcgcgtggcg 


240 


crccrc t ccrcrcc 
y ^-y ^^^yy^^ 


tcgcggcggc ggcggcggca gcggcccagc 


agttggcggc 


gagcgcgtct 


300 


crccrccfccrccrc 


ggcgggcccc gcgcccctcc tccccccctg 


ggcgcccccg 


gcggcgtgtg 


360 




tccgcggcgg cagcctcggc agcagcggcc tcggccgcct 


ctggcagccc 


420 1 


crcrcrc cccTa'ar* 


gagggctccg ctggcggcga aaagcgctcc 


accgcccctt 


cggccgcagc 


4 80* ' 




gcctcagccg cggcgtcgtc gcccgcgggg ggcggcgccg 


aggcgctgga 


54.0 -It 


crr^t" cr c*t* crcracr 


cactgcggcg tgtgcagaga gcgcctgcga 


cccgagaggg 


agccccgcct 


eoo^y 


cr c t* cr c r* c* t" cr t" 


ttgcactcgg cctgtagtgc ctgcttaggg 


cccgcggccc 


ccgccgccgc 


660 C* 


raafaopf ccr 


ggggacggcg gggcggcggg cgacggcacc 


gtggtggact 


gtcccgtgtg 


72 0 IT 


v_*c*.ci.y ca. ci_ v — 


tgcttctcca aagacatcgt ggagaattat 


ttcatgcgtg atagtggcag 


780 


c aa crcr c t cr c c 


accgacgccc aggatgcgaa ccagtgctgc 


actagctgtg 


aggataatgc 


840 


cccagccacc 


agctactgtg tggagtgctc ggagcctctg 


tgtgagacct 


gtgtagaggc 


900 


gcaccagcgg 


gtgaagtaca ccaaggacca tactgfcgcgc 


tctactgggc 


cagccaagtc 


960 


tcgggatggt 


gaacgtactg tctattgcaa cgtacacaag 


catgaacccc 


ttgtgctgtt 


1020 


ttgtgagagc 


tgtgatactc tcacctgccg agactgccag 


ctcaatgccc 


acaaggacca 


1080 


ccagtaccag 


ttcttagagg atgcagtgag gaaccagcgc 


aagctcctgg 


cctcactggt 


1140 


gaagcgcctt 


ggggacaaac atgcaacatt gcagaagagc 


accaaggagg 


ttcgcagctc 


1200 


aatccgccag 


gtgtctgacg tacagaagcg tgtgcaagtg 


gatgtcaaga 


tggccatcct 


1260 


gcagatcatg 


aaggagctga ataagcgggg ccgtgtgctg gtcaatgatg 


cccagaaggt 


1320 


gactgagggg 


cagcaggagc gcctggagcg gcagcactgg 


accatgacca 


agatccagaa 


1380 


gcaccaggag 


cacattctgc gctttgcctc ttgggctctg gagagtgaca 


acaacacagc 


1440 



i c;i ucpui 
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ccttttgctt 


tctaagaagt 


tgatctactt 


ccagctgcac 


cgggccctca 


agatgattgt 


1500 


ggatcccgtg 


gagccacatg 


gcgagatgaa 


gtttcagtgg 


gacctcaatg 


cctggaccaa 


1560 


gagtgccgag 


gcctttggca 


agattgtggc 


agagcgtcct 


ggcactaact 


caacaggccc 


1620 


tgcacccatg 


gcccctccaa 


gagccccagg 


gcccctgagc 


aagcagggct 


ctggcagcag 


1680 


ccagcccatg 


gaggtgcagg 


aaggctatgg 


ctttgggtca 


ggagatgatc 


cctactcaag 


1740 


tgcagagccc 


catgtgtcag 


gtgtgaaacg 


gtcccgctca 


ggtgagggcg 


aggtgagcgg 


1800 


ccttatgcgc 


aaggtgccac 


gagtgagcct 


tgaacgcctg 


gacctggacc 


tcacagctga 


1860 


cagccagcca 


cccgtcttca 


aggtcttccc 


aggcagtacc 


actgaggact 


acaaccttat 


1920 


tgttattgaa 


cgtggcgctg 


ccgctgcagc 


taccggccag 


ccagggactg 


cgcctgcagg 


1980 


aacccctggt 


gccccacccc 


tggctggcat 


ggccattgtc 


aaggaggagg 


agacggaggc 


2040 


tgccattgga 


gcccctccta 


ctgccactga 


gggccctgag 


accaaacctg 


tgcttatggc 


2100 


tcttgcggag 


ggtcctggtg 


ctgagggtcc 


ccgcctggcc 


tcacctagtg 


gcagcaccag 


2160 


ctcagggctg 


gaggtggtgg 


ctcctgaggg 


tacctcagcc 


ccaggtggtg 


gcccgggaac 


2220 


cctggatgac 


agtgccacca 


tttgccgtgt 


ctgccagaag 


ccaggcgatc 


tggttatgtg 


2280 


caaccagtgt 


gagttttgtt 


tccacctgga 


ctgtcacctg 


ccggccctgc 


aggatgtacc 


2340 


aggggaggag 


tggagctgct 


cactctgcca 


tgtgctccct 


gacctgaagg 


aggaggatgg 


2400 


cagcctcagc 


ctggatggtg 


cagacagcac 


tggcgtggtg 


gccaagctct 


caccagccaa 


2460 


ccagcggaaa 


tgtgagcgtg 


tactgctggc 


cctattctgt 


cacgaaccct 


gccgccccct 


2520 


gcatcagctg 


gctaccgact 


ccaccfctctc 


cctggaccag 


cccggtggca 


ccctggatct 


2580 


gaccctgatc 


cgtgcccgcc 


tccaggagaa 


gttgtcacct 


ccctacagct 


ccccacagga 


2640 


gtttgcccag 


gatgtgggcc 


gcatgttcaa 


gcaattcaac 


aagttaactg 


aggacaaggc 


2700 


agacgtgcag 


tccatcatcg 


gcctgcagcg 


cttcttcgag 


acgcgcatga 


acgaggcctt 


2760 


cggtgacacc 


aagttctctg 


Cfcqfccrctcrcrt 


qroracrccccccr 


ccgatgagcc 




O \J 


tggcctgagt 


tcccaggagc 


tgtctggtgg 


ccctggtgat 


ggcccctgag 


gctggagccc 


2880 


ccatggccag 


cccagcctgg 


ctctgttctc 


tgtcctgtca 


ccccatcccc 


actcccctgg 


2940 


tggcctgact 


cccactccct 


ggtggcccca 


tcccccagtt 


cctcacgata 


tggtttttac 


3000 


ttctgtggat 


ttaataaaaa 


aaacttcacc 


agttcaaaaa 


aaaaaaaaaa 


aaaaaa 


3056 



<210> 9 

<211> 3149 

<212> DNA 

<213> Homo sapiens 



14 

<400> 9 

agcggaatct cggaaaggcg agaaagaagc tgtctccatc ttgtctgtat ccgctgctct 60 

tgtgacgttg tggagatggg gagcgtcctg gggctgtgct ccatggcgag ctggatacca 120 

tgtttgtgtg gaagtgcccc gtgtttgcta tgccgatgct gtcctagtgg aaacaactcc - . 180 

actgtaacta gattgatcta tgcacttttc ttgcttgttg gagtatgtgt agcttgtgta 24 0 

atgttgatac caggaatgga agaacaactg aataagattc ctggattttg tgagaatgag 3 00 

aaaggtgttg tcccttgtaa cattttggtt ggctataaag ctgtatatcg tttgtgcttt 3 60 

ggtttggcta tgttctatct tcttctctct ttactaatga tcaaagtgaa gagtagcagt 42 0 

gatcctagag ctgcagtgca caatggattt tggttcttta aatttgctgc agcaattgca 48 0 

attattattg gggcattctt cattccagaa ggaactttta caactgtgtg gtttfcatgta 540 

ggcatggcag gtgccttttg tttcatcctc atacaactag tcttacttat tgattttgca 600 

cattcatgga atgaatcgtg ggttgaaaaa atggaagaag ggaactcgag atgttggtat 660 

gcagccttgt tatcagctac agctctgaat tatctgctgt ctttagttgc tatcgtcctg 720 

ttctttgtct actacactca- tccagccagt tgttcagaaa acaaggcgtt catcagtgtc 78 0 

aacatgctcc tctgcgttgg tgcttctgta atgtctatac tgccaaaaat ccaagaatca 840 

caaccaagat ctggtttgtt acagtcttca gtaattacag tctacacaat gtatttgaca 900 

tggtcagcta tgaccaatga accagaaaca aattgcaacc caagtctact aagcataatt 960 

ggctacaata caacaagcac tgtcccaaag gaagggcagt cagtccagtg gtggcatgct 1020.. 

caaggaatta taggactaat tctctttttg ttgtgtgtat tttattccag catccgtact 108 0 

tcaaacaata gtcaggttaa taaactgact ctaacaagtg atgaatctac attaatagaa 114 0 

gatggtggag ctagaagtga tggatcactg gaggatgggg acgatgttca ccgagctgta 1200 

gataatgaaa gggatggtgt cacttacagt tattccttct ttcacttcat gcttttcctg 1260 

gcttcacttt atatcatgat gacccttacc aactggtaca ggtatgaacc ctctcgtgag 1320 

atgaaaagtc agtggacagc tgtctgggtg aaaatctctt ccagttggat tggcatcgtg 1380 

ctgtatgttt ggacactcgt ggcaccactt gttcttacaa atcgtgattt tgactgagtg 144 0 

agacttctag catgaaagtc ccactttgat tattgcttat ttgaaaacag tattcccaac 1500 

ttttgtaaag ttgtgtatgt ttttgcttcc catgtaactt ctccagtgtt ctggcatgaa 15 60 

ttagatttta ctgcttgtca ttttgttatt ttcttaccaa gtgcattgat atgtgaagta 1620 

gaatgaattg cagaggaaag ttttatgaat atggtgatga gttagtaaaa gtggccacta 1680 

ttgggcttat tctctgctct atagttgtga aatgaagagt gaaaacaaat ttgtttgact 3 74 0 

attttaaaat tatattagac cttaagctgt tttagcaagc attaaagcaa atgtatggct 1800 
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gccttttaaa 



atatttgatg tgttgcctgg caggatactg caaagaacat ggtttatttt 



1860 



aaaatttata 


aacaagtcac 


ttaaatgcca ..gttg^ctgaa. aaatcttata._aggttttacc 


1920. 


cttgatacgg 


aatttacaca 


ggtagggagt 


gtttagtgga 


caatagtgta 


ggttatggat 


1980 


ggaggtgtcg 


gtactaaatt 


gaataacgag 


taaataatct 


tacttgggta gagatggcct 


2040 


ttgccaacaa 


agtgaactgt 


tttggttgtt 


ttaaactcat 


gaagtatggg 


ttcagtggaa 


2100 


atgtttggaa 


ctctgaagga 


tttagacaag gttttgaaaa ggataatcat 


gggttagaag 


2160 


gaagtgtttg 


aaagtcactt 


tgaaagttag 


ttttgggcca 


gcacggtagc 


tcacccttgt 


2220 


aatcccagca 


ctttgggagg 


ctgaggtggg 


tagattactt 


gagcccagga 


attcaagacc 


2280 


agcctgggca 


acatggtgaa 


accctgtttc 


tataaaaaat 


aatctgggct 


ttgtagcata 


2340 


tgcctgtggt 


cccagctact 


gaggaggctg aggtgggagg attgcttgag cccaggaggc 


2400 


agaggttgca 


gtgagccaag 


gtcacgtcac 


tgcactctag 


cctgggcaac 


agagtaagac 


2460 


aaaaaaatat 


atatatattg 


aaaatcaaag 


gaggcaaaat 


tttgacaggg 


aaggaagtaa 


2520 


ctgcaaaaca 


ctaggcttta 


gtaggtactt 


atataaaatc 


tagtccagtt 


ctctcattta . 


2580 


aaaaaatgaa 


gacactgaag 


tacagactta 


aatagctcag atagctaatt 


aggaaatttc 


2640 


aagttggcca 


ataatagcat 


tctctctgac 


atttaaaaat 


aatttctatt 


caaaatacat 


2700 


gcataattga 


ttttacacct 


cattactggt 


ggataattta 


tgtgatgtgg 


attgctggtg 


2760 


tccagcatga 


cccataaaca 


ggtcagaaga 


atgatggaat 


gttttagaat 


aaactcctgc 


2820. 


ttatagtata 


ctacacagtt 


caaaagatgt 


ttaaaatgct 


tttgtattta 


ctgccatgta 


2880 


attgaaatat 


atagattatt 


gtaacctttc 


aacctgaaaa 


tcaagcagta 


tgagagttta 


2940 


gttatttgta 


tgtgtcacta 


gtgtctaatg aagcttttaa aatctacaat 


ttcttcttta 


3000 


aaaatattta 


ttaatgtgaa 


tggaatataa 


caattcagct 


taattcccca 


accttattct 


3060 


gtgtgtagac 


attgtattcc 


acaattttga 


atggctgtgt 


tttacctcta 


aataaatgaa 


3120 


ttcagagaaa 


gtgaaaaaaa 


aaaaaaaaa 








3149 



<210> 10 

<211> 580 

<212> DNA 

<213> Homo sapiens 



tgcatataga gtggccacag gtttgacaca gagaccttgg tgatgtaggc tatgaacaaa 12 0 



<400> 10 

cttttttttt ttttttttta 



aagtctttag tatatttatt tgtataaaga gtaaacaaag 



60 



tttaaatggc aacttcattg 



ctgccactga accaatcctg aatttgggct caacaggtga 



180 



aaagtaacaa tatcaaacga 



atactaaaca gcataacaaa aagattttca gactcttggt 



240 
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cataaagacc gtaatcgttc acattgaatc aatgactaaa catttttgat tacccagcta 3 00 

cctccaagca aactgaaaac tgtctagtgg atcctgaagt ccatagtgcc tctagccggg 360 

tctttcaagt gttgcaccac agggtgatga ttgatggtaa aaacagggat caacccttgt 420 

agatcggtgg taagtatgga aaccctctaa gaacagtgca gcgtatgtgg tattcagact 4 80 

ggttgcatac agcattcaaa accagtgctg gaatagcttg ccccaaagtg gtagagttat 540 

aaaaggatat acattgacgt ttcttaaaag catgtgtaat 580 

<210> 11 

<211> 2467 

<212> DNA 

<213> Homo sapiens 

<400> 11 

ggcacgaggc tccggtgtgt ctgtcggttg cagtgttgga ggtcggcgcc ggcccccgcc 60 

ttccgcgccc cccacgggaa ggaagcaccc ccggtattaa aacgaacggg gcggaaagaa 120 

gccctcagtc gccggccggg aggcgagccg atgccgagct gctccacgtc caccatgccg 180 

ggcatgatct gcaagaaccc agacctcgag tttgactcgc tacagccctg cttctacccg 240 

gacgaagatg acttctactt cggcggcccc gactcgaccc ccccggggga ggacatctgg 3 00' 

aagaagtttg agctgctgcc cacgcccccg ctgtcgccca gccgtggctt cgcggagcac 3 60 

agctccgagc ccccgagctg ggtcacggag atgctgcttg agaacgagct gtggggcagc 42 0 

ccggccgagg aggacgcgtt cggcctgggg ggactgggtg gcctcacccc caacccggtc 480" 

atcctccagg actgcatgtg gagcggcttc tccgcccgcg agaagctgga gcgcgccgtg 540 ' 

agcgagaagc tgcagcacgg ccgcgggccg ccaaccgccg gttccaccgc ccagtccccg 6 00 

ggagccggcg ccgccagccc tgcgggtcgc gggcacggcg gggctgcggg agccggccgc 660 

gccggggccg ccctgcccgc cgagctcgcc cacccggccg ccgagtgcgt ggatcccgcc 72 0 

gtggtcttcc cctttcccgt gaacaagcgc gagccagcgc ccgtgcccgc agccccggcc 730 

agtgccccgg cggcgggccc tgcggtcgcc tcgggggcgg gtattgccgc cccagccggg 840 

gccccggggg tcgcccctcc gcgcccaggc ggccgccaga ccagcggcgg cgaccacaag 900 

gccctcagta cctccggaga ggacaccctg agcgattcag atgatgaaga tgatgaagag 960 

gaagatgaag aggaagaaat cgacgtggtc actgtggaga agcggcgttc ctcctccaac 1020 

accaaggctg tcaccacatt caccatcact gtgcgtccca agaacgcagc cctgggtccc 1080 

gggagggctc agtccagcga gctgatcctc aaacgatgcc ttcccatcca ccagcagcac 114 0 

aactatgccg ccccctctcc ctacgtggag agtgaggatg cacccccaca gaagaagata 1200 

aagagcgagg cgtccccacg tccgctcaag agtgtcatcc ccccaaaggc taagagcttg 1260 
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actctgactc ggaggacagt gagcgtcgca gaaaccacaa catcctggag 


1320 




gcaacgacct tcgcjtccagc tttctcacgc. tcagggacca. .cgtgccggag. 


. .13 80 




atgagaaggc cgccaaggtg gtcattttga aaaaggccac tgagtatgtc 


1440 


^ — C*. V* L» \^ . L. V_» \_ 


aggccgagga gcaccagctt ttgctggaaa aggaaaaatt gcaggcaaga 


1500 


O a cr r* a rr r* a rr f* 


tgctaaagaa aattgaacac gctcggactt gctagacgct tctcaaaact 


1560 


tfT<T£5 /~i -f— f-t —\ /~t 

yyataytCclC 


tgccactttg cacattttga tttttttttt aaacaaacat tgtgttgaca 


1620 




tggtttactt tcaaatcggt cccctgtcga gttcggctct gggtgggcag 


1680 




agtgtggggt tctgcfcggga ccttggagag cctgcatccc aggafcgctgg 


1740 


g uy yCCCtgc 


agcctcctcc acctcacctc catgacagcg ctaaacgttg gtgacggttg 


1800 


ggagcccctg 


gggctgttga agtcaccttg tgtgttccaa gtttccaaac aacagaaagt 


1860 


cattccctct 


ttttaaaatg gtgcttaagt tccagcagat gccacataag gggtttgcca 


1920 


4** 4-" 4"* 4— ^ • 

LLugataccc 


ctggggaaca tttctgtaaa taccattgac acatccgcct tttgtataca 


1980 


Lcctyggtaa 


tgagaggtgg cttttgcggc cagtattaga ctggaagttc atacctaagt 


2040 


acfcgfcaataa 


tacctcaatg tttgaggagc atgttttgta tacaaatata ttgttaatct 


2100 


ccgtcacgca 


ctgtactaat tcttacactg cctgtatact ttagtatgac gctgatacat 


2160 


aactaaatct 


gatacttata tfcttcgtatg aaaatgagtt gtgaaagttt tgagtagata 


2220 


ttactttatc 


actttttgaa ctaagaaact tttgtaaaga aatttactat atatatatgc 


2280 


ctttttccta 


gcctgtttct tcctqrttaat Qtatttcrttc atcrtfcfccrcrfcci raf^oaprha 


A -J ft U 


ggtaaatgca 


aagttctgtg tttaatttct tcaaaatgta tatatttagt gctgcatctt 


2400 


atagcacttt 


gaaatacctc atgtttatga aaataaatag cttaaaatta aaaaaaaaaa 


2460 


aaaaaaa 




2467 


<210> 12 

<211> 762 

<212> DNA 

<213> Homo sapiens 




<400> 12 
taccattctt 


caagaaacgg tttgaatcag actgcctttc cttttgtctt cattgtcata 


60 


aacatctgcc 


cccgtgtggt tctgactggc cgcgaacccc tacccgaagc ttttattcca 


120 


tcattgtgca 


ccgttggtgg ggaatgctgt ggcaacaggc cacgcctcca cttactggtt 


180 


ggctttgcgc 


aggcgccaac ggaagtgggt cgcaggaaga ggaagtcccg cctctctctc 


240 


ctcaggcagc 


agcaacgcgg aggaaacggg agtgaacgga gagcgtagtg accatcatga 


300 


gcctcctcaa 


caagcccaag agtgagatga ccccagagga gctgcagaag cgagaggagg 


360 
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aggaatttaa caccggtcca ctctctgtgc tcacacagtc agtcaagaac aatacccaag 420 

tgctcatcaa ctgccgcaac aataagaaac tcctgggccg cgtgaaggcc ttcgataggc 48 0 

actgcaacat ggtgctggag aacgtgaagg agatgtggac tgaggtaccc aagagtggca 54 0 

agggcaagaa gaagtccaag ccagtcaaca aagaccgcta catctccaag atgttcctgc 600 

gcggggactc agtcatcgtg gtcctgcgga acccgctcat cgccggcaag taggggccgc 660 

ctgtctgttg acagaactca ctcctctgtc ctatgaagac cgctgccatt ggtgttgaga 720 

ataataaagc tctgtgtttt tttctaaaaa aaaaaaaaaa aa 762 

<210> 13 

<211> 3379 

<212> DNA 

<213> Homo sapiens 

<400> 13 

aattccgcgg aatcatcgga atccttcacc atggcatcca gcccggccca gcgtcggcga 60 

ggcaatgatc ctctcacctc cagccctggc cgaagctccc ggcgtactga tgccctcacc 12 0 

tccagccctg gccgtgacct tccaccattt gaggatgagt ccgaggggct cctaggcaca 180 

gaggggcccc tggaggaaga agaggatgga gaggagctca ttggagatgg catggaaagg 24 0 

gactaccgcg ccatcccaga gctggacgcc tatgaggccg agggactggc tctggatgat 3 00 

gaggacgtag aggagctgac ggccagtcga agggaggcag cagacgggcc atgcggcacg 3 60 

si 

gtgaccggga gctggccggg gcfcgggcgca tgcgccgtgg gctcctgtat gacagcgatg 420 

aggaggacga ggagcgccct gcccgcaagc gccgccagtg gagccggcac ggaggacggc 480 

gaggaggacg agcagatgat tgagagcatc gagaacctgg aggatctcaa aggccactct 54 0 

gtgcgcgagt gggtgagcat ggcgggcccc cggctggaga tccaccaccg cttcaagaac 600 

ttcctgcgca ctcacgtcga cagccacggc cacaacgtct tcaaggagcg catcagcgac 66 0 

atgtgcaaag agaaccgtga gagcctggtg gtgaactatg aggacttggc agccagggag 720 

cacgtgctgg cctacttcct gcctgaggca ccggcggagc tgctgcagat ctttgatgag 780 

gctgccctgg aggtggtact ggccatgtac cccaagtacg accgcatcac caaccacatc 84 0 

catgtccgca tctcccacct gcctctggtg gaggagctgc gctcgctgag gcagctgcat 9 00 

ctgaaccagc tgatccgcac cagtggggtg gtgaccagct gcactggcgt cctgccccag 9 60 

ctcagcatgg tcaagtacaa ctgcaacaag tgcaatttcg tcctgggtcc tttctgccag 1020 

tcccagaacc aggaggtgaa accaggctcc tgtcctgagt gccagtcggc cggccccttt 1080 

gaggtcaaca tggaggagac catctatcag aactaccagc gtatccgaat ccaggagagt 114 0 

ccaggcaaag tggcggctcg gcggctgccc cgctccaagg acgccattct cctcgcagat 12 0 0 



i ci uepui 
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gctgcaacgc aggagacgag atagagctga ctggcatcta 


tcacaacaac 


1260 


fcafccrafccrcict 


ccctcaacac tg;ccaatggc . ttccctgtct t.tgcqactgi; _catc.ctagcc 


132Q- 


aac c a eg t g g 


ccaagaagga caacaaacrtt crcfccrtaaacrcr aactcranrfTa 


t-gaagaugcg 


1380 


aacrafcerai - r*a 


ctagcctctc caacrcrafccacr cacratccrcracr acraaer;=»t-r*t-t- 


tgecagcatt 


1440 




tCtatCTCltCa tCfaacracatG aaCTa era ercrr*r» r't-rrr^r^rrrtv* 


c ctgc u egga 


1500 




aaaaCCCaCTCT fcCTCTCaaGfr' ^^rrrrf-ar»rrf-rr rrfrr^*- ^t-n-a ^ 


c 9tgctcttg 


1560 


^y <~y y agacc 


v* v-.a.v*-ca.y w yacxvj uv*>y t-*ciy LUtLtCaay t atat Uy agaa 


agtgtccagc 


1620 




tcaccactgg ecagggggeg tcggctgtgg ccgtcacggc 


gtatgtccag 


1680 




tcagcaggga gtggaccttg gaggctgggg ccctggttct 


ggctgaccga 


1740 


yy dy '-y L-y uc 


tcattgatga atttgacaag atgaatgacc aggacagaac 


cagcatccat 


1800 


cr a cr cr o f s t* rrrr 
y c*y y ^ ct uy y 


agcaacagag catctccatc tcgaaggctg gcatcgtcac 


ctccctgcag 


1860 


y^Luycuyca 


eggtcattge tgccgccaac cccataggag ggegctaega 


cccctcgctg 


1920 


aCLLuCuCuy 


agaacgtgga cctcacagag cccatcatct caegctttga catcctgtgt 


1980 


ytgyugaggg 


acaccgtgga cccagtccag gaegagatge tggcccgctt 


cgtggtgggc 


2040 


/~f r"~« /— t "3 (—f}— 

c»y ^^aCy tCa 


gacaccaccc cagcaacaag gaggaggagg ggctggccaa 


tggcageget 


2100 


yt-tydyeccg 


ccatgcccaa caegtatgge gtggagcccc tgccccagga 


ggtcctgaag 


2160 


ra ri f- -a -a 4- y~» 
ctdy LdCatCa 


tctacgccaa ggagagggtc cacccgaagc tcaaccagat 


ggaccaggac 


2220 


aaggtggcca 


agatgtacag tgacctgagg aaagaatcta tggegacagg 


cagcatcccc 


2280 


at fcacggtgc 


ggcacatcga gtccatgagt catggeggag gcccacgcgc gcatccatct 


2340 


gegggactat 


gtgatcgaag aegaegtcaa catggccatc cgcgtgatgc tggagagctt 


2400 


catagacaca 


cagaagttca gcgtcatcgc ageatgegea agacttttgc 


ccgctacctt 


2460 


tcactccggc 


gtgacaacaa tgagctgttg ctcttcatac tgaagcagtt 


agtggcagag 


2520 


ca yy cgacat 


ateagegcaa ccgctttggg gcccagcagg acactattga 


ggtccctgag 


2580 


ctdy y cic u tgg 


tggataaggc tegtcagate aacatccaca acctctctgc 


attttatgac 


2640 


agngagcncc 


tcaggatgaa caagttcagc cacgacctga aaaggaaaat 


gatcctgeag 


2700 


cagttctgag 


gccctatgcc atccataagg attccttggg attctggttt ggggtggtca 


2760 


gcgccccccg 


tgctttatgg acacaaaacc agagcacttg atgaactegg ggtactaggg 


2820 


tcagggctta 


tagcaggatg tetggctgea cctggcatga ctgtttgttt 


ctccaagcct 


2880 


gctttgtgct 


tctcaccttt gggtgggatg ccttgccagt gtgtcttact 


tggttgctga 


2940 


acatcttgcc 


acctccgagt gctttgtctc cactcagtac cttggatcag agetgetgag 


3000 


ttcaggatgc 


ctgcgtgtgg tttaggtgtt agecttctta catggatgtc 


aggagagctg 


3060 
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ctgccctctt ggcgtgagtfc gcgtattcag gctgcttttg ctcgctttgg ccagagagct 3120 

ggttgaagat gtttgtaatc gttttcagtc tcctgcaggt ttctgtgccc ctgtggtgga 3180 

agaggcacga cagtgccagc gcagcgttct gggctcctca gtcgcagggg tgggatgtga 3240 

gtcatgcgga ttatccactc gccacagtta tcagctgcca ttgctccctg tctgtttccc 33 00 

cactctctta tttgtgcatt cggtttggtt tctgtagttt taatttttaa taaagttgaa 3 3 60 

taaaatataa aaaaaaaaa 33 79 

<210> 14 

<211> 1488 

<212> DNA 

<213> Homo sapiens 

<400> 14 

gttggtgagc atcatggcaa ccgttacagc cacaaccaaa gtcccggaga tccgtgatgt 60 

aacaaggatt gagcgaatcg gtgcccactc ccacatccgg ggactggggc tggacgatgc 120 

cttggagcct cggcaggctt cgcaaggcat ggtgggtcag ctggcggcac ggcgggcggc 180 

tggcgtggtg ctggagatga tccgggaagg gaagattgcc ggtcgggcag tccttattgc 240 

tggccagccg ggcacgggga agacggccat cgccatgggc atggcgcagg ccctgggccc 3 00 

tgacacgcca ttcacagcca tcgccggcag tgaaatcttc tccctggaga tgagcaagac 3 60 

cgaggcgctg acgcaggcct tccggcggtc catcggcgtt cgcatcaagg aggagacgga 420 

gatcatcgaa ggggaggtgg tggagatcca gattgatcga ccagcaacag ggacgggctc 48 0 

caaggtgggc aaactgaccc tcaagaccac agagatggag accatctacg acctgggcac 540 

caagatgatt gagtccctga ccaaggacaa ggtccaggcc ggggacgtga tcaccatcga 600 

caaggcgacg ggcaagatct ccaagctggg ccgctccttc acacgcgccc gcgactacga 66 0 

cgctatgggc tcccagacca agttcgtgca gtgcccagat ggggagctcc agaaacgcaa 72 0 

ggaggtggtg cacaccgtgt ccctgcacga gatcgacgtc atcaactctc gcacccaggg 78 0 

cttcctggcg ctcttctcag gtgacacagg ggagatcaag tcagaagtcc gtgagcagat 840 

caatgccaag gtggctgagt ggcgcgagga gggcaaggcg gagatcatcc ctggagtgct 900 

gttcatcgac gaggtccaca tgctggacat cgagagcttc tccttcctca accgggccct 960 

ggagagtgac atggcgcctg tcctgatcat ggccaccaac cgtggcatca cgcgaatccg 1020 

gggcaccagc taccagagcc ctcacggcat ccccatagac ctgctggacc ggctgcttat 108 0 

cgtctccacc accccctaca gcgagaaaga cacgaagcag atcctccgca tccggtgcga 1140 

ggaagaagat gtggagatga gtgaggacgc ctacacggtg ctgacccgca tcgggctgga 120 0 

gacgtcactg cgctacgcca tccagctcat cacagctgcc agcttggtgt gccggaaacg 126 0 
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caagggtaca gaagtgcagg tggatgacat caagcgggtc tactcactct tcctggacga 132 0 

gtcccgctcc acgcagtaca" tgaaggagta "ccaggacgcc ttcctcttca acgaactcaa * 1380 

aggcgagacc atggacacct cctgagttgg atgtcatccc ccgaccccac cctgttttcc 1440 

accagagttc tgacactgtg actctgtata aaatggttgg gaagctgc 14 8 8 

<210> 15 

<211> 1811 

<212> DMA 

<213> Homo sapiens 

<400> 15 

ggtttgtgta gagaggcgtg cagagcccgt tgtccggagt gcacctgctg cctgttctgt 60 

ccctcccggg agcccccgcc gctgtcgccg tcgagtcgcc atggaagtgc agaaagaggc 12 0 

acagcgcatc atgaccctgt cggtgtggaa gatgtatcac tcccgcatgc agcgcggtgg 18 0 

cctgcggctg caccggagtc tgcagctgtc gctggtcatg cgcagcgccc gggagctcta 240 

cctctcggcc aaggtggagg ccctcgagcc cgaggtgtcg ttgccggccg ccctcccctc . 300 

tgaccctcgc ctgcacccgc cccgagaagc cgagtccacg gccgagacag cgacccccga 3 60 

cggtgagcac ccgtttccgg agccaatgga cacgcaggag gcgccgacag ccgaggagac 42 0 

ctccgcctgc tgtgccccgc gccccgccaa agtcagccgc aaacgacgca gcagcagcct 480 

gagcgacggc ggggacgttg gactggtccc gagcaagaaa gcccgtctgg aagaaaagga 54 0 

agaagaggag ggagcgtcat ccgaagtcgc cgatcgcctg cagccccctc cgggccaagc 600 

ggagggcgcc tttcccaacc tggcccgcgt cctgcagagg cgcttctccg gcctcctgaa 660 

ctgcagcccc gcggcccctc cgacggcgcc gcccgcgtgc gaggcaaagc ccgcttgccg 720 

cccggcggac agcatgctca acgtgctcgt gcgggccgtg gtggccttct gaggaccccg 780 

agcggcgctg ccggagccca gagcgcgcgt cgaaccgtcg gcccgagggc gcagacctga 840 

ggcgaggcca cccccctcca tcctggggga agcgcccgcg aaaaccgtgg agagaagccg 900 

ccgcccgggc tgctgagagg cccggagagg actctgtccc cggggagcca tcgccttcag 960 

tgtgcaggga cggcaccgag gagtctgagc cgggcgcggg cgccttccgc agagacctgc 1020 

gcccacaggt gctgtcttag tggactggga cgtgaacctt tcgctctcct tctggactgg 1080 

gagaagggag gcttgggtgt tgtgtttttt gttttgtttg tttgtttgtt tttaaagatc 1140 

tcctcagggt cggacttcat tttgtactgt gggctgtgct ggccctttca aggtttttca 1200 

agagttggtt ttgcgtttcc aacctcggag aattccaggc actccccttc cccctccgct 12 60 

gacatacttg tataagcggt catcgttgcg tcatggggca ggcgtgggga gcttcctgtc 1320 

gccttggctg ggtgtgggcc tggaggaagg tcctggggcg tgcactcgcc tgggcagtgg 13 8 0 
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ggaggagagt ggcctgagtt acttcacccc cgcgtgctgc tggttaatgt cccgcgtctc 144 0 

tgcaccttcg ggtgggagcg gggactgatc tactttcaca ttctcaagtt tttctcatct 1500 

gcattagagg tccccagtag gttcccaggt tccagcgtgc ccctccctca gacacacgga 1550 

cacaatcagc cgagaagttc ctggtctgaa tcacgagaat gtggaggggt ggggggtgtc 162 0 

agtggaaagg cataaggctg agctgagacc agttgctggt gaaactgggc caatctgggg 168 0 

aggggaacat ccttgccagg gagtttctga gggtctgctt tgtttacctt tcgtgcggtg 1740 

gattcttttt aactccgtct acctggcgtt ttgttagaaa tgtcagatag gaaaataaaa 1800 

accatttgag t 1811 

<210> 16 

<211> 2038 

<212> DNA 

<213> Homo sapiens 

<400> 16 

ggcccgcggg actcagacca gcggggagcg cggcctccgc ccttggggcc ctcccgccgg 6 0. 

gccggagacc caagccccca acgccaggcc ctgccctgga agcgctcgcg gcccggcgcc 120 

tggacggggg agttgctgct ctttggcgta aattgcaatc gattagggat cgtttctcag 180 

aatcaagtta gaagtgagag ttcagataag tgaggccgcc attgctgctt tgaacacctc 240 

agaaggggag aatggattta tcaggagtga aaaagaagag cttgctagga gtcaaagaaa 300 

ataataaaaa gtccagcact agggctcctt cacctaccaa acgcaaagac cgctcagatg 3 60 

agaagtccaa ggatcgctca aaagataaag gggccaccaa ggagtcgagt gagaaggatc 42 0 

gcggccggga caaaacccga aagaggcgca gcgcttccag tggtagcagc agtaccaggt 48 0 

ctcggtccag ctcgacttcc agctcaggct ccagcaccag cactggctca agcagtggct 540 

ccagctcttc ctcagcatcc agccgctcag gaagctccag cacctcccgc agctccagct 600 

ctagcagctc ttctggctct ccaagtcctt ctcggcgcag acacgacaac aggaggcgct 660 

cccgctccaa atccaaacca cctaaaagag atgaaaagga gaggaaaagg cggagcccat 720 

ctcctaagcc caccaaagtg cacattggga gactcacccg gaatgtgaca aaggatcaca 78 0 

tcatggagat attttccacc tatgggaaaa ttaaaatgat tgacatgccc gtggaaagga 84 0 

tgcatcccca tctgtccaaa ggctatgcgt acgtagagtt tgagaatcca gatgaagccg 9 00 

agaaggcgct gaagcacatg gatggaggac aaattgatgg ccaggagatc actgccaccg 9 60 

ccgtgctggc cccctggcct aggccacccc ccaggagatt cagccctccc aggagaatgt 1020 

tgccaccacc gccfcatgtgg cgcaggtctc ccccacggat gaggagaagg tcccgctccc 108 0 

cgaggcgcag gtcccccgtg cgccggagat cacggtcccc gggccgccgc cgccacagga 1140 
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gccgctccag 


ctccaactcc 


tcccgataaa 


caggccactg 


aagctctcgc ccctgtaact 


1200 


tataccccac 


ccagctcagt 


tttgtcactt 


ttctagccaa 


aggaagacca gtaggaaagc 


1260 


aaacccttga 


ctctggcagg 


atttgcaggc 


agcaggcagc 


acccctctgc cagccgggcc 


1320 


ccggctgcag 


aagtgctgtt 


ggtttggatg 


ctgtgtgcct 


gtcaagattc cctccggttt 


1380 


tctggctaga 


aagctcatcc 


gtttccggtt 


tctaagagtc 


agttcagtgg cagagccacc 


1440 


agggaaaagt 


gaggctcttg 


ggggtggttt 


gaccctgctt 


acctgggagc acacttttcc 


1500 


cttccccgat 


gacctgggat 


ggtggccagg 


ccgtgccctt gctgttgctg ggcagtgtcc 


1560 


ttttggaaag 


ggagctgccc 


caggctttag 


tgcagctgcc 


aaccctgtta ggcctggcct 


1620 


ctcgaggcct 


cttctgacct 


caagggtcac 


accccctcaa 


agatcctctc acccatggta 


1680 


gttgctgctc 


gtggttctgt 


ctgtccgtgc 


accgatgcac 


acaccgcacc ccaccactgt 


1740 


actctgaaat 


tggcgagtga 


gtggagagcc 


agctctgcgg agtcatcacg cagccatggt 


1800 


tgtgcctgcc 


gttcatggtg 


gtctttcagg 


ttatcttggc 


aacatgtaca ttgcttttat 


1860 


tttttttctt 


ttttgctttc 


attgtacagt 


cagtactata 


aaatttctct tttgagtttt 


1920 


atacctttgt 


agcattttag 


atgacattgt 


gtttgtactt 


tgttgtgtag agtggaagaa 


1980 


ttgtgttgaa 


taaacccaag 


atcggaatgc 


aaaaaaaaaa 


aaaaaaaaaa aaaaaaaa 


2038. 


<210> 17 

<211> 2062 

<212> DNA 

<213> Homo sapiens 


• 








<400> 17 
gtcagtccct 


cctgtagccg 


ccgccgccgc 


cgcccgccgc 


ccctctgcca gcagctccgg 


60 


cgccacctcg 


ggccggcgtc 


tccggcgggc 


gggagccagg 


cgctgacggg cgcggcgggg 


120 


gcggccgagc 


gctcctgcgg 


ctgcgactca 


ggctccggcg 


tctgcgcttc cccatggggc 


180 


tggcctgcgg 


cgcctgggcg 


ctctgagatt 


gtcactgctg 


ttccaagggc acacgcagag 


240 


ggatttggaa 


ttcctggaga 


gttgcctttg 


tgagaagctg 


gaaatatttc tttcaattcc 


300 


atctcttagt 


tttccatagg 


aacatcaaga 


aatcatgaac aactttggta atgaagagtt 


360 


tgactgccac 


ttcctcgatg 


aaggttttac 


tgccaaggac 


attctggacc agaaaattaa 


420 


tgaagtttct 


tcttctgatg 


afcaaggatgc 


cttctatgtg gcagacctgg gagacatfcct 


Ann 


aaagaaacat 


ctgaggtggt 


taaaagctct 


ccctcgtgtc 


accccctttt atgcagtcaa 


540 


atgtaatgat 


agcaaagcca 


tcgtgaagac 


ccttgctgct 


accgggacag gatttgactg 


600 


tgctagcaag 


actgaaatac 


agttggtgca 


gagtctgggg gtgcctccag agaggattat 


660 


ctatgcaaat 


ccttgtaaac 


aagtatctca 


aattaagtat 


gctgctaata atggagtcca 


720 
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gatgatgact tttgatagtg aagttgagtt gatgaaagtt gccagagcac 


atcccaaagc 


780 


aaagttggtt ttgcggattg ccactgatga ttccaaagca gtctgtcgtc 


tcagtgtgaa 


840 


attcggtgcc acgctcagaa ccagcaggct ccttttggaa cgggcgaaag 


agctaaatat 


900 


cgatgttgtt ggtgtcagct tccatgtagg aagcggctgt accgatcctg 


agaccttcgt 


960 


gcaggcaatc tctgatgccc gctgtgtttt tgacatgggg gctgaggttg 


gtttcagcat 


.1020 


gtatctgctt gatattggcg gtggctttcc tggatctgag gatgtgaaac 


ttaaatttga 


1080 


agagatcacc ggcgtaatca acccagcgtt ggacaaatac tttccgtcag actctggagt 


1140 


gagaatcata gctgagcccg gcagatacta tgttgcatca gctttcacgc 


ttgcagttaa 


1200 


tatcattgcc aagaaaattg tattaaagga acagacgggc tctgatgacg 


aagatgagtc 


1260 


gagtgagcag acctttatgt attatgtgaa tgatggcgtc tatggatcat 


ttaattgcat 


1320 


actctatgac cacgcacatg taaagcccct tctgcaaaag agacctaaac cagatgagaa 


1380 


gtattattca tccagcatat ggggaccaac atgtgatggc ctcgatcgga 


ttgttgagcg 


1440 


ctgtgacctg cctgaaatgc atgtgggtga ttggatgctc tttgaaaaca 


tgggcgctta 


1500 


cactgttgct gctgcctcta cgttcaafcgg cttccagagg ccgacgatct 


actatgtgat 


1560 


gtcagggcct gcgtggcaac tcatgcagca attccagaac cccgacttcc 


cacccgaagt 


1620 v 


agaggaacag gafcgccagca ccctgccfcgt gtcttgtgcc tgggagagtg 


ggatgaaacg 


1680 


ccacagagca gcctgtgctt cggctagtat taatgtgtag atagcactct 


ggtagctgtt 


1740 


aactgcaagt ttagcttgaa ttaagggatt tggggggacc atgtaactta 


attactgcta 


1800 


gttttgaaat gtctttgtaa gagtagggtc gccatgatgc agccatatgg aagactagga 


1860 


tatgggtcac acttatctgt gttcctatgg aaactatttg aatatttgtt 


ttatatggat 


1920 


ttttattcac tcttcagaca cgctactcaa gagtgcccct cagctgctga 


acaagcattt 


1980 


gtagcttgta caatggcaga atgggccaaa agcttagtgt tgtgacctgt 


ttttaaaata 


2040 


aagtatcttg aaataattag gc 




2062 



<210> 18 

<211> 2989 

<212> DNA 

<213> Homo sapiens 

<400> 18 

aattcgggca cgagggtcct ccctccgcag cagccgagcc ggacctgcct ccccgggcgt 60 

gctccgccgg ccccgccgcc ggcccgcagc gacagacagg cgctccccgc agctccgcac 120 

gggacccagg ccgccggacc ccagcgccgg accaccctct gtccgccccg aggagtttgc 180 

cgcctgccgg agcacctgcg cacagatgga gctggaccac cggaccagcg gcgggctcca 24 0 



I til UtfjJUl 
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cgcctacccc 


gggccgcggg 


gcgggcaggt 


ggccaagccc 


aacgtgatcc 


fcgeagategg 


300 


gaagtgccgg 


gecgagatge 


tggagcacgt 


gcggcggacg 


caccggcacc 


tgctggccga 


3 50 


ggtgtccaag 


caggtggagc 


gcgagctgaa 


ggggctgeae 


eggteggteg 


ggaagctgga 


420 


gagcaacctg 


gaeggctacg 


tgcccacgag 


cgactcgcag 


cgctggaaga 


agtccatcaa 


480 


ggcctgcctg 


tgccgctgcc 


aggagaccat 


cgccaacctg 


gagcgctggg 


teaagegega 


540 


gatgcacgtg 


tggegegagg 


tgttctaccg 


cctggagcgc 


tggg cc gacc 


gcctggagtc 


600 


cacgggcggc 


aagtaccegg 


tgggcagega 


gtcagcccgc 


cacaccgttt 


ccgtgggcgt 


660 


ggggggtccc 


gagagctact 


gccacgaggc 


agaeggctae 


gactacaccg 


tcagccccta 


720 


cgccatcacc 


ccgcccccag 


ccgctggcga 


gctgcccggg 


caggagcccg 


ccgaggccca 


780 


gcagtaccag 


ccgtgggtcc 


ccggcgagga 


cgggcagccc 


agccccggcg 


tggacacgea 


840 


gatcttcgag 


gaccctcgag 


agttcctgag 


ccacctagag 


gagtacttgc 


ggcaggtggg 


900 


cggctcfcgag 


gagtactggc 


tgtcccagat 


ccagaatcac 


atgaaeggge 


eggecaagaa 


960 


gtggtgggag 


ttcaagcagg 


gctccgtgaa 


gaactgggtg 


gagttcaaga 


aggagttcct 


1020 


gcagtacagc 


gagggcaege 


tgtcccgaga 


ggccatccag 


egggagctgg 


acctgccgca 


1080 


gaagcagggc 


gagcegctgg 


accagttcct 


gtggcgcaag 


egggacctgt 


accagacgct 


1140 


ctacgtggac 


geggacgagg 


aggagatcat 


ecagtaegtg 


gtgggcaccc 


tgcagcccaa 


1200 


gctcaagcgt 


ttcctgcgcc 


accccctgcc 


caagaccctg 


gagcagctca 


tccagagggg 


1260 


catggaggtg 


caggatgacc 


tggagcaggc 


ggccgagccg 


gccggccccc 


acctcccggt 


1320 


ggaggatgag 


gcggagaccc 


tcacgcccgc 


ccccaacagc 


gagtccgtgg 


ccagtgaccg 


1380 


gacccagccc 


gagtagaggg 


catcccggag 


cccccagcct 


gcccactaca 


tccagcctgt 


1440 


ggctttgccc 


accaggactt 


ttgagctggg 


gctgactcct 


gcaggggaag 


ccctggtcca 


1500 


gctgggtgcc 


ccctcgagct 


ccgggcggac 


tcgcacacac 


tcgtgtcatc 


cagatgtgag 


1560 


caccgcaccc 


ageggcaaag 


agccctcccc 


cctgcagggc 


tccacccatc 


accctccctc 


1620 


cgtctgtctt 


tccggcctgg 


accccaccct 


ccacactctc 


aggccatcac 


agaacacccc 


1680 


agcttcctca 


ttctgetaca 


acacccaggc 


cctctggaca 


tccagaaaac 


caagtgtccg 


1740 


era fc Qcr cacrcrcr 


crc c a crccrcr cc 


C3. \ — V — C3.C4.y v.* L. 


■f- rrrrrrsi n 

t«y y y cn— cl 


agag cagaag 


c c agggcaga 


i q r\ n 


gecaatgetg 


agggagcetc 


gacttccggc 


gccgccgccc 


tctcccggca 


tccgcagagc 


1860 


cagctgacgc 


cctccctgcc 


tcccagggca 


gctggccagc 


ctcgggcagc 


gcggccccct 


1920 


cctcccaggg 


gagagtagaa 


gtcgcacacg 


cagcagagca 


gaccfcgatgt 


cccggtgctt 


1980 


cctggcccct 


cagctccagt 


gattcacgcc 


cgcctggaga 


agaatcagag 


ctcagctcat 


2040 
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gactcaccca tggcaggcgg agggtcccag aggggctgag tcctcaaatc cggctgaggc 2100 

agcagctggc accatcagag ccaggagagt gacaacaggt ctcaaggttc ccacaaagtc 2160 

tttgctgctg tgctgggcac cacccacccc tcaccttgca ggctgcctgc gtgggaggcg 222 0 

aagtcccagg acagcccaga ggggggctac agagaggagt cggctgcagc agagggcagg 2280 

agccccagct tagccctgag cgccagcgcg aggaccaggg cctgccacta agcccgcccc 234 0 

gctggccgcc agctgcccgt ccccagagcc actgcagcag gagtcgggcc ctgcctccct 24 00 

cccagcaggg aaaccccgcc cgctgccagg ccatcctctc tgccagaggc tttcatgagc 246 0 

cccaaggctg gggccacagc tcctacccct gcccagcagc cctgagctca gctgcaggaa 2520 

ggacatccca gaagccatgg ctcctggggc gcttccaggc attctgccct gccccgacac 258 0 

cagaaccctg gtgctggtgg gccactagcg tctgcagcct aagcaggtgc tggctcaggg 264 0 

ttcatcgttc tgccttgtcc actgggggac cagccctgca gaccactctg acaagtcttc 2700 

agcccacacc ctgccagccc cacagatttt atttttgcac ataagccata accaatcctc 2760 

aaggctggca caggctttgg ggaagccctg gagcctgtga agaccctgga aacctcatga 2820 

ggctgtggcc aacccctgcc ccttgcccca cacagaccag gccttaaatg tcggtccagg 2 88 0 

ccctgtgcac cttaccccag agacagactc tttttgtaag attttgttaa taaaacactg 2940 e . 

aaacttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 2989 

<210> 19 
<211> 2365 

<212> DNA %. 
<213> . Homo sapiens 

<400> 19 

gaaacggccc gagaagctcg cccggagaac ggggaggaat atgctgtgga gctcctctgc 60 

catataaaca aaaagaggaa atctttcaaa catggctgaa gcaaagaccc actggcttgg 12 0 

agcagccctg tctcttatcc ctttaatttt cctcatctct ggggctgaag cagcttcatt 18 0 

tcagagaaac cagctgcttc agaaagaacc agacctcagg ttggaaaatg tccaaaagtt 240 

tcccagtcct gaaatgatca gggctttgga gtacatagaa aacctccgac aacaagctca 3 00 

taaggaagaa agcagcccag attataatcc ctaccaaggt gtctctgtcc cccttcagca 3 60 

aaaagaaaat ggcgatgaaa gccacfctgcc cgagagggat tcactgagtg aagaagactg 420 

gatgagaata atactcgaag ctttgagaca ggctgaaaat gagcctcagt ctgcaccaaa 480 

agaaaataag ccctatgcct tgaattcaga aaagaacttt ccaatggaca tgagtgatga 540 

ttatgagaca cagcagtggc cagaaagaaa gcttaagcac atgcaattcc ctcctatgta 6 00 

tgaagagaat tccagggata acccctttaa acgcacaaat gaaatagtgg aggaacaata 66 0 



27 



tactcctcaa 
accaaacaac 
agatgatatc 
gaacccagta 
gaatatagga 
ccaggaagaa 
aattgcctat 
aaatggggaa 
gctgattgaa 
aactggggag 
cctagatgac 
ctccaagagt 
gctcagtgtt 
gtcgtatttt 
tggaagatct 
acagatggca 
gatgctagtt 
aggctcatct 
tttgaatcaa 

tgtggggccc 

aatgaaagtg 
taagagagca 
caccccaagc 
taatatcttt 
tcctctgagc 
atttattatg 
ggctgtggca 
tttttaatat 
aaaaaaataa 



agccttgcta 
cagaaacgtg 
tacaaggcta 
gaggagaaaa 
aaaaatgaac 
gatcttcgga 
ttgaaaaggt 
agggccacca 
atctcaagga 
aagccgaatg 
atctcagagg 
ggctacccta 
gaggatattt 
cccaatccat 
agatcgaacc 
tatgaaaacc 
aaataccctg 
gaagatgacc 
ggcagctctc 
ccgaagaatg 
ctggaatacc 
atggaaaata 
aaatcccaac 
aaatgatgta 
tgttatcttg 
tccattattc 
ttgttgatgc 
ttattgaatt 
agcattataa 



cattggaatc 
agaggatgga 
ataacattgc 
tagagagtca 
aaatcaacga 
aagagagtaa 
tagtaaatgc 
ggctttttga 
atttacagat 
gatcagtgga 
ctgacttaga 
aaacacctgg 
taaatctttt 
ataaccagga 
agcttcccaa 
tgaacgacaa 
agatcattaa 
tgcaggaaga 
aggagactga 
atgatacccc 
tcaatcaaga 
tgtaagctgc 
atttctcttc 
caggcagatg 
tgtatggata 
aagaaagata 
tcacatatga 
attttgttac 
atata 



tgtcttccaa gagctgggga aactgacagg 72 0 

tgaggagcaa_ aaact t tata cggatgat_ga 780- 

ctatgaagat gtggtcgggg gagaagactg 84 0 
aacccaggaa gaggtgagag acagcaaaga 900 
tgagatgaaa cgctcagggc agcttggcat 960 
agaccaactc tcagatgatg tctccaaagt 1020 
tgcaggaagt gggaggttac agaatgggca 1080 
gaaacctctt gattctcagt ctatttatca 1140 
acccccagaa gacttaattg agatgctcaa 12 0 0 
accggagcgg gagcttgacc ttcctgttga 1260 
ccatccagac ctgttccaaa ataggatgct 1320 
tcgtgctggg actgaggccc taccagacgg 138 0 
agggatggag agtgcagcaa atcagaaaac . 1440 
gaaagttctg ccaaggctcc cttatggtgc 1500 
agctgcctgg attccacatg ttgaaaacag 1560 

ggatcaagaa ttaggtgagt acttggccag 1620 

ttcaaaccaa gtgaagcgag ttcctggtca 1680 

ggaacaaatt gagcaggcca tcaaagagca 1740 

caagctggcc ccggtgagca aaaggttccc 18 00 

aaataggcag tactgggatg aagatctgtt 1860 

aaaggcagaa aagggaaggg agcatattgc 192 0 

tttcattaat taccctactt tcattcctcc 1980 

agtgtgttga cttctatcct gttaacactg 2 04 0 

aaaccaggtc actggggagt ctgcttcatt 2100 

tgtgtaaatg ttatgactcc ttgataaaaa 2160 

tctatgactg tgtttaatag tatatctaat 2220 

taaaaaagtg tcctataatt ctattgaaag 2280 

tgtctgtagc gttttgtgga gtactggacc 234 0 

2365 



<210> 20 
<211> 2825 
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<212> DNA 

<213> Homo sapiens 

<400> 20 



gtacggcttc 


cggtggcggg 


acgcggggcc gcgcacgcgg gaaaagcttc 


cccggtgtcc 


60 


ccccatcccc 


ctccccgcgc 


cccccccgcg tccccccagc 


gcgcccacct 


ctcgcgccgg 


120 


ggccctcgcg 


aggccgcagc 


cfccracrcracTat tcccaacctcr 


ctgagcatcc 


gcacacccac 


180 


tcaggagttg 


gggcccagct 


cccagtttac ttggtttccc 


ttgtgcagcc 


tggggctctg 


240 


cccaggccac 


cacaggcagg 


ggtcgacatg gcagagacac 


tggagttcaa 


cgacgtctat 


300 


caggaggtga 


aaggttccat 


gaatgatggt cgactgaggt 


tgagccgtca 


gggcatcatc 


360 


ttcaagaata 


gcaagacagg 


caaagtggac aacatccagg 


ctggggagtt 


aacagaaggt 


420 


atctggcgcc 


gtgttgctct 


gggccatgga cttaaactgc 


ttacaaagaa 


tggccatgtc 


480 


tacaagtafcg 


atggcttccg 


agaatcggag tttgagaaac 


tctctgattt 


cttcaaaact 


540 


cactatcgcc 


ttgagctaat 


ggagaaggac ctttgtgtga agggctggaa 


ctgggggaca 


600 


gtgaaatttg 


gtgggcagct 


gctttccttt gacattggtg 


accagccagt 


ctttgagata 


660 


cccctcagca 


atgtgtccca 


gtgcaccaca ggcaagaatg 


aggtgacact 


ggaattccac 


72 0. 


caaaacgatg acgcagaggt" gtctctcatg gaggtgcgct tctacgtccc 


acccacccag 


7 8 0:; 


gaggatggtg 


tggaccctgt 


tgaggccttt gcccagaatg 


tgttgtcaaa 


ggcggatgta 


84 0;, 


atccaggcca 


' cgggagatgc 


catctgcatc ttccgggagc 


tgcagtgtct 


gactcctcgt 


9Q0j 


ggtcgttatg 


acattcggat 


ctaccccacc tttctgcacc 


tgcatggcaa 


gacctttgac 


960 /5 


tacaagatcc 


cctacaccac 


agtactgcgt ctgtttttgt 


taccccacaa 


ggaccagcgc 


3-020,,; 


cagatgttct 


ttgtgafccag 


cctggatccc ccaatcaagc 


aaggccaaac 


tcgctaccac 


1080 


ttcctgatcc 


tcctcttctc 


caaggacgag gacatttcgt 


tgactctgaa 


catgaacgag 


1140 


gaagaagtgg 


agaagcgctt 


tgagggtcgg ctcaccaaga 


acatgtcagg 


atccctctat 


1200 


gagatggtca 


gccgggtcat 


gaaagcactg gtaaaccgca 


agatcacagt 


gccaggcaac 


1260 


ttccaagggc 


actcaggggc 


ccagtgcatt acctgttcct 


. acaaggcaag 


ctcaggactg 


1320 


ctctacccgc 


tggagcgggg 


cttcatctac gtccacaagc 


cacctgtgca 


catccgcttc 


1380 


gatgagatct 


cctttgtcaa 


ctttgctcgt ggtaccacta 


ctactcgttc 


ctttgacttt 


1440 


gaaattgaga 


ccaagcaggg 


cactcagtat accttcagca 


gcattgagag 


ggaggagtac 


1500 


gggaaactgt 


ttgattttgt 


caacgcgaaa aagctcaaca 


tcaaaaaccg 


aggattgaaa 


1560 


gagggcatga 


acccaagcta 


cgatgaatat gctgactctg atgaggacca 


gcatgatgcc 


1620 


tacttggaga 


ggatgaagga 


ggaaggcaag atccgggagg 


agaatgccaa 


tgacagcagc 


1680 


gatgactcag 


gagaagaaac 


cgatgagtca ttcaacccag 


gtgaagagga 


ggaagatgtg 


1740 
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gcagaggagt 


ttgacagcaa 


cgcctctgcc 


agctcctcca 


gtaatgaggg tgacagtgac 


1800 


cgggatgaga 


agaagcggaa 


acagctcaaa 


aaggccaaga 


tggccaagga ccgcaagagc 


I860 


cgcaagaagc 


ctgtggaggt 


gaagaagggc 


aaagacccca 


atgcccccaa gaggcccatg 


1920 


tctgcataca 


tgctgtggct 


caatgccagc 


cgagagaaga 


tcaagtcaga ccatcctggc 


1980 


atcagcatca 


cggatctttc 


caagaaggca 


ggcgagatct 


ggaagggaat gtccaaagag 


2040 


aagaaagagg 


agtgggatcg 


caaggctgag 


gatgccagga gggactatga aaaagccatg 


2100 


aaagaatatg 


aagggggccg 


aggcgagtct 


tctaagaggg acaagtcaaa gaagaagaag 


2160 


aaagtaaagg 


taaagatgga 


aaagaaatcc 


acgccctcta 


ggggctcatc atccaagtcg 


2220 


tcctcaaggc 


agctaagcga 


gagcttcaag 


agcaaagagt 


ttgtgtctag tgatgagagc 


2280 


tcttcgggag 


agaacaagag 


caaaaagaag 


aggaggagga 


gcgaggactc tgaagaagaa 


2340 


gaactagcca 


gtactccccc 


cagctcagag 


gactcagcgt 


caggatccga tgagtagaaa 


2400 


cggaggaagg 


ttctctttgc 


gcttgccttc 


tcacaccccc 


cgactcccca cccatatttt 


2460 


ggtaccagtt 


tctcctcatg 


aaatgcagtc 


cctggattct gtgccatctg aacatgctct 


2520 


cctgttggtg 


tgtatgtcac 


tagggcagtg 


gggagacgtc 


ttaactctgc tgcttcccaa 


2580 


ggatggctgt 


ttataatttg 


gggagagata 


gggtgggagg 


cagggcaatg caggatccaa 


2640 


atcctcatct 


tactttcccg 


accttaagga 


tgtagctgct 


gcttgtcctg ttcaagttgc 


2700 


tggagcaggg 


gtcatgtgag 


gccaggcctg 


tagctcctac 


ctggggccta tttctacttt 


2760 


cattttgtat 


ttctggtctg 


fcgaaaatgat 


ttaataaagg 


gaactgactt tggaaaccaa 


2820 


aaaaa 










2825 


<210> 21 

<211> 10488 

<212> DNA 

<213> Homo sapiens 










<400> 21 
aagagttttc 


ctccgcagct 


ctgagtctcc 


acttttttgg 


tggagaaagg ctgcaaaaag 


60 


aaaaagagac 


gcagtgagtg 


ggaaaagtat 


gcatcctatt 


caaacctaat tgaatcgagg 


120 


agcccaggga 


cacacgcctt 


caggtttgct 


caggggttca 


tatttggtgc ttagacaaat 


180 


tcaaaatgag gaaacatcgg 


cacttgccct 


tagtggccgt 


cttttgcctc tttctctcag 


240 


gctttcctac aactcatgcc 


cagcagcagc 


aagcagatgt 


caaaaatggt gcggctgctg 


300 


atataatatt 


tctagtggat 


tcctcttgga 


ccattggaga 


ggaacatttc caacttgttc 


360 


gagagtttct 


atatgatgtt 


gtaaaatcct 


tagctgtggg 


agaaaatgat ttccattttg 


420 


ctctggtcca 


gttcaacgga 


aacccacata 


ccgagttcct 


gttaaatacg tatcgtacta 


480 
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aacaagaagt cctttctcat atttccaaca tgtcttatat tgggggaacc aatcagactg 
gaaaaggatt agaatacata atgcaaagcc acctcaccaa ggctgctgga agccgggccg 
gtgacggagt ccctcaggtt atcgtagtgt taactgatgg acactcgaag gatggccttg 
ctctgccctc agcggaactt aagtctgctg atgttaacgt gtttgcaatt ggagttgagg 
atgcagatga aggagcgtta aaagaaatag caagtgaacc gctcaatatg catatgttca 
acctagagaa ttttacctca cttcatgaca tagtaggaaa cttagtgtcc tgtgtgcatt 
catccgtgag fcccagaaagg gctggggaca cggaaaccct taaagacatc acagcacaag 
actctgctga cattattttc cttattgatg gatcaaacaa caccggaagt gtcaatttcg 
cagtcattct cgacttcctt gtaaatctcc ttgagaaact cccaattgga actcagcaga 
tccgagtggg ggtggtccag tttagcgatg agcccagaac catgttttcc ttggacacct 
actccaccaa ggcccaggtt ctgggtgcag tgaaagccct cgggtttgct ggtggggagt 
tggccaatat cggcctcgcc cttgatttcg tggtggagaa ccacttcacc cgggcagggg 
gcagccgcgt ggaggaaggg gttccccagg tgctggtcct cataagtgcc gggccttcta 
gtgacgagat tcgctacggg gtggtagcac tgaagcaggc tagcgtgttc tcattcggcc 
ttggagccca ggccgcctcc agggcagagc ttcagcacat agctaccgat gacaacttgg 
tgtttactgt cccggaattc cgtagctttg gggacctcca ggagaaatta ctgccgtaca 
ttgttggcgt ggcccaaagg cacattgtct tgaaaccgcc aaccattgtc acacaagtca 
ttgaagtcaa caagagagac atagtcttcc tggtggatgg ctcatctgca ctgggactgg 
ccaacttcaa tgccatccga gacttcattg ctaaagfccat ccagaggctg gaaatcggac 
aggatcttat ccaggtggca gtggcccagt atgcagacac tgtgaggcct gaattttatt 
tcaataccca tccaacaaaa agggaagtca taaccgctgt gcggaaaatg aagcccctgg 
acggctcggc cctgtacacg ggctctgctc tagactttgt tcgtaacaac ctattcacga 
gttcagccgg ctaccgggct gccgagggga ttcctaagct tttggtgctg atcacaggtg 
gtaagtccct agatgaaatc agccagcctg cccaggagct gaagagaagc agcataatgg 
cctttgccat tgggaacaag ggtgccgatc aggctgagct ggaagagatc gctttcgact 
cctccctggt gttcatccca gctgagttcc gagccgcccc attgcaaggc atgctgcctg 
gcttgctggc acctctcagg accctctctg gaacccctga agttcactca aacaaaagag 
atatcatctt tcttttggat ggatcagcca acgttggaaa aaccaatttc ccttatgtgc 
gcgactttgt aatgaaccta gttaacagcc ttgatattgg aaatgacaat attcgtgttg 
gtttagtgca atttagtgac actcctgtaa cggagttctc tttaaacaca taccagacca 



540 

600 

660 

720 

780 

840 

900 

960 
1020 
1080 
1140 
1200 
1260 
1320^ 
13 80^ 
1440 
1500 xK 

■> 

1560 a 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 



31 



agtcagatat ccttggtcat ctgaggcagc tgcagctcca gggaggttcg ggcctgaaca 2340 

.. CaggCtCa9C . ^*.?^^..«cc«ttc«. .ggaagcfeggc ggcagcagga . .2400 

tccgtgaaca cgtgccgcag ctcctgcttc tgctcacagc tgggcagtct gaggactcct 2460 

atttgcaagc tgccaacgcc ttgacacgcg cgggcatcct gactttttgt gtgggagcta 2520 

gccaggcgaa taaggcagag cttgagcaga ttgcttttaa cccaagcctg gtgtatctca 2580 

tggatgattt cagctccctg ccagctttgc ctcagcagct gattcagccc ctaaccacat 2640 

atgttagtgg aggtgtggag gaagtaccac tcgctcagcc agagagcaag cgagacattc 2700 

tgttcctctt tgacggctca gccaatcttg tgggccagtt ccctgttgtc cgtgactttc .2760 

tctacaagat tatcgatgag ctcaatgtga agccagaggg gacccgaatt gcggtggctc 2820 

agtacagcga tgatgtcaag gtggagtccc gttttgatga gcaccagagt aagcctgaga 2880 

tcctgaatct tgtgaagaga atgaagatca agacgggcaa agccctcaac ctgggctacg 294 0 

cgctggacta tgcacagagg tacatttttg tgaagtctgc tggcagccgg atcgaggatg 3000 

gagtgcttca gttcctggtg ctgctggtcg caggaaggtc atctgaccgt gtggatgggc 3 060 

cagcaagtaa cctgaagcag agtggggttg tgcctttcat cttccaagcc aagaacgcag 312 0 

accctgctga gttagagcag atcgtgctgt ctccagcgtt tatcctggct gcagagtcgc 318 0 

ttcccaagat tggagatctt catccacaga tagtgaatct cttaaaatca gtgcacaacg 3240 

gagcaccagc accagtttca ggtgaaaagg acgtggtgtt tctgcttgat ggctctgagg 3300 

gcgtcaggag cggottccct ctgttgaaag agtttgtcca gagagtggtg gaaagcctgg 3360 

atgtgggcca ggaccgggtc cgcgtggccg tggtgcagta cagcgaccgg accaggcccg 342 0 

agttctacot gaattcatac atgaacaagc aggacgtcgt caacgctgtc cgccagctga 348 0 

ccctgctggg agggccgacc cccaacaccg gggccgccct ggagtttgtc ctgaggaaca 3540 

tcctggtcag ctctgcggga agcaggataa cagaaggtgt gccccagctg ctgatcgtcc 3600 

tcacggccga caggtctggg gatgatgtgc ggaacccctc cgtggtcgtg aagaggggtg 3660 

gggctgtgcc cattggcatt ggcatcggga acgctgacat cacagagatg cagaccatct 3720 

ccttcatccc ggactttgcc gtggccattc ccacctttcg ccagctgggg accgtccaac 3780 

aggtcatctc tgagagggtg acccagctca cccgcgagga gctgagcagg ctgcagccgg 3840 

tgttgcagcc tctaccgagc ccaggtgttg gtggcaagag ggacgtggtc tttctcatcg 3900 

atgggtccca aagtgccggg cctgagttcc agtacgttcg caccctcata gagaggctgg 3 960 

ttgactacct ggacgtgggc tttgacacca cccgggtggc tgtcatccag ttcagcgatg 4020 

accccaaggc ggagttcctg ctgaacgccc attccagcaa ggatgaagtg cagaacgcgg 4080 

tgcagcggct gaggcccaag ggagggcggc agatcaacgt gggcaatgcc ctggagtacg 4140 
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tgtccaggaa 


catcttcaag 


aggcccctgg ggagccgcat 


tgaagagggc 


gtcccacagt 


4200 


tcctggtcct 


catctcgtct ggaaagtctg acgatgaggt ggtcgtcccg 


gcggtggagc 


4260 


tcaagcagtt 


tggcgtggcc 


cctttcacga tcgccaggaa 


cgcagaccag 


gaggagctgg 


4320 


tgaagatctc 


gctgagcccc 


gaatatgtgt tctcggtgag 


caccttccgg 


gagctgccca 


4380 


gcctggagca 


gaaactgctg 


acgcccatca cgaccctgac 


ctcagagcag 


atccagaagc 


4440 


tcttagccag 


cactcgctat 


ccacctccag cagttgagag 


tgatgctgca 


gacattgtct 


4500 


ttctgatcga 


cagctctgag ggagttaggc cagatggctt 


tgcacatatt 


cgagattttg 


4560 


ttagcaggat 


tgttcgaaga 


ctcaacatcg gccccagtaa 


agtgagagtt 


ggggtcgtgc 


4620 


agttcagcaa 


tgatgtcttc 


ccagaattct atctgaaaac 


ctacagatcc 


caggccccgg 


4680 


tgctggacgc 


catacggcgc 


ctgaggctca gaggggggtc 


cccactgaac 


actggcaagg 


4740 


ctctcgaatt 


tgtggcaaga aacctctttg ttaagtctgc ggggagtcgc 


atagaagacg 


4800 


gggtgcccca 


acacctggtc 


ctggtcctgg gtggaaaatc 


ccaggacgat 


gtgtccaggt 


4860 


tcgcccaggt 


gatccgfctcc 


tcgggcattg tgagtttagg ggtaggagac 


cggaacatcg 


4920 


acagaacaga 


gctgcagacc 


atcaccaatg accccagact 


ggtcttcaca 


gtgcgagagt 


4980 


tcagagagct 


tcccaacata 


gaagaaagaa tcatgaactc 


gtttggaccc 


tccgcagcca 


5 04 0, 


ctcctgcacc 


tccaggggtg 


gacacccctc ctccttcacg 


gccagagaag 


aagaaagcag 


5100 


acattgtgtt 


cctgttggat 


ggttccatca acttcaggag 


ggacagtttc 


caggaagtgc 


5160 


ttcgttttgt 


gtctgaaata gtggacacag tttatgaaga 


tggcgactcc 


atccaagtgg 


5220 


ggcttgtcca 


gtacaactct 


gaccccactg acgaattctt 


cctgaaggac 


ttctctacca 


5280 


agaggcagat 


tattgacgcc 


atcaacaaag tggtctacaa 


agggggaaga 


cacgccaaca 


5340 


ctaaggtggg 


ccttgagcac 


ctgcgggtaa accactttgt 


gcctgaggca 


ggcagccgcc 


5400 


tggaccagcg 


ggtccctcag 


attgcctttg tgatcacggg 


aggaaagtcg 


gtggaagatg 


5460 


cacaggatgt 


gagcctggcc 


ctcacccaga ggggggtcaa 


agtgtttgct 


gttggagtga 


5520 


ggaatatcga 


ctcggaggag 


gttggaaaga tagcgtccaa 


cagcgccaca 


gcgttccgcg 


5580 


tgggcaacgt 


ccaggagctg 


tccgaactga gcgagcaagt 


tttggaaact 


ttgcatgatg 


5640 


cgatgcatga 


aaccctttgc 


cctggtgtaa ctgatgctgc 


caaagcttgt 


aatctggatg 


5700 


tgattctggg 


gtttgatggt 


tctagagacc agaatgttfct 


tgtggcccag 


aagggcttcg 


5760 


agtccaaggt 


ggacgccatc 


ttgaacagaa tcagccagat 


gcacagggtc 


agctgcagcg 


5820 


gtggccgctc 


gcccaccgtg 


cgtgtgtcag tggtggccaa 


cacgccctcg 


ggcccggtgg 


5880 


aggcctttga 


ctttgacgag taccagccag agatgctcga 


gaagttccgg 


aacatgcgca 


5940 
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gccagcaccc 


ctacgfcccfcc 


a c erer a crcra c a 
a ^yy»yy dv-ci 


c y ctcty y l» 


ctacctgaac 


aagttcagac 


6000 


agtcctcgcc 


cr era c acrccrt cr 


aa erer tercrt" r*a 




. tgatcjgagca ..gaeggagatq 


&0.£0_ 


fcggctgattt 


acacagagca 


fcctcracraapp 


i" PPOfPPa amria 
u*— y utady cl 


a gg a 9*tccgt 


gccttgatcc 


6120 


tcrcr t cracrc c t 


t craaccracrt" cr 


y u^aau uyy 


a g c ggc u aat 


gcatctggag 


tttgggcgag 


6180 


cfafcfcfcafccrfca 


L.y cty y > — v— \^ 


i~i f- /to rr^r 4~ a 


acucgccgga 


cttggattat 


gaaefcagegg 


6240 


acrcacrr» 1* t~ era 


e*aa r*a t~ hrrpp 


y cxy cictciy C u L. 


gccgtggggt 


tccctgcaag 


tgctctgggc 


6300 


acracrcrcrera era 
**y °-y yyy ^-y a. 




»tcyycayca 


tegggecaaa 


gggtattcct 


ggagaagacg 


6360 


gctaccgagg 


ct"at" e , r*t*crcrt~ 
v— ■ l« c*. ^ v— v. — ***y y ^* 


er £5 t" pa < » it 1 1 • rr 

g» tyag gg eg 


gac c eggu ga 


gcgtggtccg 


cctggtgtga 


6420 


acacrcactca 


a erer t* t* f~ r* e» a rr 
ciy y <— i— i — ^ o cty 


yyctycccyy 


gc cagagagg 


agtaaagggc 


teteggggat 


648 0 


tT , r*e , aerera era 


y^ayyycgaa 


gcaggagaaa 


ttggactgga 


tggtctggat 


ggtgaagatg 


6540 


era era e* a a a rrer 
y cty cj-t^cicLcty y 


o 4- 4— /~r-/~t f~% 4— r*rr\ 1 * 

aLLyCCtyy L 


uCucct-ggag 


ag aaagggaa 


tcctggaaga aggggtgata 


6600 


«.ciy y aLL. uuy 


a yy a y a y a ^ a 


ggagaaagag 


gagatgttgg 


gattcgaggg 


gaecegggta 


6660 


a e , e*e , anYT2a z> 
cLou^ciyy ct(«Q 


ayaC ay C Cay 


gagagaggac 


ccaaaggaga 


aaceggtgae 


ctcggcccca 


672 0 


t*errreri~erf" <t~* 


agggagagau 


gg a g i - acct g 


gaggacctgg 


agaaactggg 


aagaatggtg 


6780 


Ofct* t* , r~ercre , e , cr 

y v_ u l. i^y y \— v— y 


cici yyyy cit ''- c 


cccggagcua 


agggcaa caa 


gggeggtect 


ggc cage egg 


6840 


cr o t* t"t~ era crerrr 


ay <ig c aggg g 


accagaggtg 


cacagggccc 


agctggtcct 


gctggtcctc 


6900 




aggagaacaa 


ggcatttctg 


gacctagggg 


aagcggaggt 


gcccgtggcg 


6960 


ol.cc ty gaga 


acgagg caga 


accggtccac 


tgggaagaaa 


gggtgagccc 


ggagagccag 


7020 


y aC C aaadyy 


aggaat eggg 


aacccgggcc 


ctcgtgggga 


gaegggagat 


gaegggagag 


7080 


aeggagu tgg 


cagtgaagga 


egcagaggea 


aaaaaggaga 


aagaggattt 


cctggatacc 


7140 


c agga c caaa 


gggtaaccca 


ggtgaacctg 


ggctaaatgg 


aacaacagga 


cccaaaggca 


7200 


4— /i a f«f »j rrrrrtrirT 

tLay^agyCCy 


aaggggaaafc 


tcgggacctc 


cagggatagt 


tggacagaag gggagacctg 


7260 


rrpt* a ppnarrrr 
y v^- ua^^oayy 


accagccggu 


ccaaggggca 


acaggggega 


ctccatcgat 


caatgtgccc 


7320 


LUaLLCaaay 


caccaaagaxz. 


aaat g c cc 1 1 


gctgttacgg 


gcccctggag 


tgccccgtct 


7380 




aCtayCCCCC 


gctfctagaca 


c c t c tgaggg 


agtcaaccaa 


gacactttcg 


7440 


y ccyyatyCy 


agatgtgg t c 


ttgagtattg 


tgaatgtcct 


gaecattget 


gagagcaact 


7500 


etc* f~* nrra prffiff 


ggcccgggcg 


gctgtggtca 


cctacaacaa 


cgaggtgacc 


aeggagatec 


7560 


ggtttgctga 


ctccaagagg 


aagteggtec 


tcctggacaa 


gafctaagaaG 


cttcaggtgg 


7620 


ctctgacatc 


caaacagcag 


agtctggaga 


ctgccatgtc 


gtttgtggcc 


aggaacacat 


7680 


ttaagcgtgt 


gaggaaegga 


ttcctaatga 


ggaaagtggc 


tgttttcttc 


agcaacacac 


7740 


ccacaagagc 


atccccacag 


ctcagagagg 


ctgtgctcaa 


actctcagat 


geggggatea 


7800 
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cccccttgtt 


ccttacaagg 


caggaagacc 


ggcagctcat 


caacgctttg 


cagatcaata 


7860 


acacagcagt 


ggggcatgcg 


cttgtcctgc 


ctgcagggag 


agacctcaca 


gacttcctgg 


7920 


agaatgtcct 


cacgtgtcat 


gtttgcttgg 


acatctgcaa 


catcgaccca 


tcctgtggat 


7980 


ttggcagttg 


gaggccttcc 


ttcagggaca 


ggagagcggc 


agggagtgat 


gtggacatcg 


8040 


acatggcttt 


catcttagac 


agcgctgaga 


ccaccaccct 


gttccagttc 


aatgagatga 


8100 


agaagtacat 


agcgtacctg 


gtcagacaac 


tggacatgag 


cccagafcccc 


aaggcctccc 


8160 


agcacttcgc 


cagagtggca 


gttgtgcagc 


acgcgccctc 


tgagtccgtg 


gacaatgcca 


8220 


gcatgccacc 


tgtgaaggtg 


gaattctccc 


tgactgacta 


tggctccaag 


gagaagctgg 


8280 


tggacttcct 


cagcagggga 


atgacacagt 


tgcagggaac 


csigggcctta 


ggcagtgcca 


8340 


ttgaatacac 


catagagaat 


gtctttgaaa 


gtgccccaaa 


cccacgggac 


cfcgaaaattg 


8400 


tggtcctgat 


gctgacgggc 


gaggtgccgg 


agcagcagct 


ggaggaggcc 


cagagagtca 


8460 


tcctgcaggc 


caaatgcaag 


ggctacttct 


tcgtggtcct 


gggcattggc 


aggaaggtga 


8520 


acatcaagga 


ggtatacacc 


ttcgccagtg 


agccaaacga 


cgtcttcttc 


aaattagtgg 


8580 


acaagtccac 


cgagctcaac 


gaggagcctt 


tgatgcgctt 


cgggaggctg 


ttgccgtcct 


8640 


tcgtcagcag 


tgaaaatgct 


ttttacttgt 


ccccagatat 


caggaaacag 


tgtgattggt 


8700 


tccaagggga 


ccaacccaca 


aagaaccttg 


tgaagtttgg 


tcacaaacaa 


gtaaatgtfcc 


8760 


cgaataacgt 


tacttcaagt 


cctacatcca 


acccagtgac 


gacaacgaag 


ccggtgacta 


8820 


cgacgaagcc 


ggtgaccacc 


acaacaaagc 


ctgtaaccac 


cacaacaaag 


cctgtgacta 


8880 


ttataaatca 


gccatctgtg 


aagccagccg 


ctgcaaagcc 


ggcccctgcg 


aaacctgtgg 


8940 


ctgccaagcc 


tgtggccaca 


aagacggcca 


ctgfctagacc 


cccagtggcg 


gtgaagccag 


9000 


caacagcagc 


gaagcctgta 


gcagcaaagc 


cagcagctgt 


aagacccccc 


gctgctgctg 


9060 


caaaaccagt 


ggcgaccaag 


cctgaggtcc 


ctaggccaca 


ggcagccaaa 


ccagctgcca 


9120 


ccaagccagc 


caccactaag 


cccgtggtta 


agatgctccg 


tgaagtccag 


gtgtttgaga 


9180 


taacagagaa 


cagcgccaaa 


ctccactggg 


agaggcctga 


gccccccggt 


ccttattttt 


9240 


atgacctcac 


cgtcacctca 


gcccatgatc 


agtccctggt 


tcfcgaagcag 


aacctcacgg 


9300 


tcacggaccg 


cgtcattgga 


ggcctgctcg 


ctgggcagac 


ataccatgtg 


gctgtggtct 


9360 


gctacctgag 


gtctcaggtc 


agagccacct 


accacggaag 


tttcagtaca 


aagaaatctc 


9420 


agcccccacc 


tccacagcca 


gcaaggtcag 


cttctagttc 


aaccatcaat 


ctaatggtga 


9480 


gcacagaacc 


attggctctc 


actgaaacag 


atatatgcaa 


gttgccgaaa 


gacgaaggaa 


9540 


cttgcaggga 


tttcatatta 


aaatggtact 


atgatccaaa 


caccaaaagc 


tgtgcaagat 


9600 
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tctggtatgg 


aggttgtggt ggaaacgaaa acaaatttgg atcacagaaa gaatgtgaaa 


9660 


aggtttgcgc 


tcctgtgctc gccaaacccg _gagtcatcag_ tgtgatggga acctaag.cgt . 


. _.S720- 


999tggccaa 


catcatatac 


ctcttgaaga agaaggagtc agccatcgcc aacttgtctc 


9780 


tgtagaagct 


ccgggtgtag attcccttgc actgtatcat ttcatgcttt gatttacact 


9840 


caaactcaaa 


agggaacatc 


ctgctgcatg acctatcacrt atqcrtcrctaa totatctafca 


9900 


gaccctcgct 


ctctgtctcc 


acrcacrfcfcctc tcqaatactt fceraafcerttafc. o^aarao^^•fl 


9960 


crccactcrctcr 


gtgtttatgt 


CraacattCCt atcaatrraa »t~t"r , r»r , t*r*'hrr frarrf-t-hz-'atTr 


10020 


ttatgcctgt 


tgcaggcaaa 


tgtaaagtct agaaaataat gcaaatgtca cggctactct 


10080 


atatacfcttt 


gcttggttca 


ttttttttcc cttttagtta agcatgactt tagatgggaa 


10140 


erect at a tat 


cgtggagaaa 


caagagacca actttttcat tccctgcccc caatttccca 


10200 


era c t aaat t* fc 


caagctaatt 


ttctttttct gaagectcta acaaatgatc tagttcagaa 


10260 


ggaagcaaaa 


tcccttaatc 


tatgtgcacc gttgggacca atgccttaat taaagaattt 


10320 


aaaaaagttg 


taatagagaa 


tatttttggc attcctctca atgttgtgtg tttttttttt 


10380 


ttgtgtgctg 


gagggagggg 


atttaatttt aattttaaaa tgtttaggaa atttatacaa 


10440 


agaaactttt 


taataaagta 


tattgaaagt ttaaaaaaaa aaaaaaaa 


10488 



<210> 22 

<211> 1044 

<212> DNA 

<213> Homo sapiens 




<400> 22 
gaattccctg 


aggaggegaa teeggegggt ateagageca tcagaaccgc caccatgacg 


60 


gtgggcaaga 


gcagcaagat getgeagcat attgattaca ggatgaggtg catcctgcag 


120 


gaeggcegga 


tcttcattgg caccttcaag gcttttgaca agcacatgaa tttgatcctc 


180 


tgtgactgtg 


atgagttcag aaagatcaag ccaaagaact ccaaacaagc agaaagggaa 


240 


gagaagegag 


tcctcggtct ggtgctgctg cgaggggaga atctggtctc aatgacagta 


300 


gagggacctc 


ctcccaaaga tactggtatt gctcgagttc cacttgetgg agetgeeggg 


360 


ggcccaggga 


teggcaggge tgctggcaga ggaatcccag ctggggttcc catgccccag 


420 


gctcctgcag 


gaettgetgg gccagtccgt ggggttggcg ggccatccca acaggtgatg 


480 


accccacaag 


gaagaggtac tgttgcagcc getgeagctg ctgccacagc cagtattgee 


540 


ggggctccaa 


cccagtaccc acctggccgt gggggtcctc ccccacctat gggccgagga 


600 


gcaccccctc 


caggcatgat gggcccacct cctggtatga gacctcctat gggtccccca 


660 


atggggatcc 


cccctggaag agggactcca atgggcatgc cccctccggg aatgeggect 


720 
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cctccccctg ggatgcgagg ccttctttga cccttggcca cagagtatgg aagtagctcc 780 

gcagaggcgt gggctcgatt cctcagggcc acgttaccac agacctgttt gtttcttatg 840 

ctgttgttcg tggagtctca tgggattgtc tggtttccct tacagggccc cctcccccgg 900 

gaatgcgccc accaaggccc tagactcatc ttggccctcc tcagctccct gcctgtttcc 960 

cgtaaggctg tacatagtcc ttttatctcc ttgtggccta tgaaactggt ttataataaa 1020 

ctcttaagag aacattataa ttgc 1044 

<210> 23 

<211> 1475 

<212> DNA 

< 2 1 3 > Homo sapi ens 

<400> 23 

gtcgacgcgg ccgcgctccg ctcccgtgag taacttggct ccgggggctc cgctcgcctg 60 

cccgcacgcc gcccgccacc caggaccgcg ccgccggcct ccgccgctag caaacccttc 120 

cgacggccct cgctgcgcaa gccgggacgc ctctcccccc tccgcccccg ccgcggaaag 18 0 

ttaagtttga agagggggga agaggggaac atggacatga agaggaggat ccacctggag 240 

ctgaggaacc ggaccccggc agctgttcga gaacttgtct tggacaattg caaatcaaat 300 

gatggaaaaa ttgagggctt aacagctgaa tttgtgaact tagagttcct cagtttaata 3 60. 

aatgtaggct tgatctcagt ttcaaatctc cccaagctgc ctaaattgaa aaagcttgaa 420 

ctcagtgaaa atagaatctt tggaggtctg gacatgttag ctgaaaaacfc tccaaatctc 480 

acacatctaa acttaagtgg aaataaactg aaagatatca gcaccttgga acctttgaaa 540. 

aagttagaat gtctgaaaag cctggacctc tttaactgtg aggttaccaa cctgaatgac 600 

taccgagaga gtgtcttcaa gctcctgccc cagcttacct acttggatgg ctatgaccga 660 

gaggaccagg aagcacctga ctcagatgcc gaggtggatg gtgtggatga agaggaggag 72 0 

gacgaagaag gagaagatga ggaagacgag gacgatgagg atggtgaaga agaggagttt 780 

gatgaagaag atgatgaaga tgaagatgta gaaggggatg aggacgacga tgaagtcagt 84 0 

gaggaggaag aagaafcttgg acttgatgaa gaagatgaag atgaggatga ggatgaagag 900 

gaggaagaag gtgggaaagg tgaaaagagg aagagagaaa cagatgatga aggagaagat 960 

gattaagacc ccagatgacc tgcagaaaca gaactgttca gtattggttg gactgctcat 1020 

ggattttgta gctgtttaaa aaaaaaaaaa aggtagctgt gatacaaacc ccaggacacc 108 0 

cacccaccca aagagccaaa gaatagttcc tgtgacattc cgccttcctt ccatgtagtc 114 0 

cctcttggta atctaccacc aagcttgtgg acttcacccc aacaaaattg taagcgttgt 1200 

taggtttttg tgtaagattc ttgctgtagc gtggatagct gtgattggtg agtcaaccgt 126 0 
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ctgtggctac cagttacact gagattgtaa cagcattttt actttctgta caacaaaaaa 13 20 
. ? cttt .? t . aaa ta . a . aa tctta acattttggg tctgtttttt qatgctttgc . ttfcttaatta - - -1380- 

ttattattat tttttttaca ttaggacatt ttatgtgaca actgccaaaa aagtattttt 1440 

aagaatttaa gcgaaataaa cagttactct ttggc 1475 

<210> 24 

<211> 2690 

<212> DNA 

<213> . Homo sapiens 

<400> 24 

gctcttttct cgggacggga gaggccgtgt agcgtcgccg ttactccgag gagataccag 60 

tcggtagagg agaagtcgag gttagaggga actgggaggc actttgctgt ctgcaatcga 12 0 

agttgagggt gcaaaaatgc agagtaataa aacttttaac ttggagaagc aaaaccatac 180 

tccaagaaag catcatcaac atcaccacca gcagcagcac caccagcagc aacagcagca 24 0 

gccgccacca ccgccaatac ctgcaaatgg gcaacaggcc agcagccaaa atgaaggctt 300 

gactattgac ctgaagaatt ttagaaaacc aggagagaag accttcaccc aacgaagccg 3 60 

tctttttgtg ggaaatcttc ctcccgacat cactgaggaa gaaatgagga aactatttga 42 0 

gaaatatgga aaggcaggcg aagtcttcat tcataaggat aaaggatttg gctttatccg 48 0 

cttggaaacc cgaaccctag cggagattgc caaagtggag ctggacaata tgccactccg 54 0 

tggaaagcag ctgcgtgtgc gctttgcctg ccatagtgca tcccttacag ttcgaaacct 600 

tcctcagtat gtgtccaacg aactgctgga agaagccttt tctgtgtttg gccaggtaga 660 

gagggctgta gtcattgtgg atgatcgagg aaggccctca ggaaaaggca ttgttgagtt 72 0 

ctcagggaag ccagctgctc ggaaagctct ggacagatgc agtgaaggct ccttcctgct 78 0 

aaccacattt cctcgtcctg tgactgtgga gcccatggac cagttagatg afcgaagaggg 840 

acttccagag aagctggtta taaaaaacca gcaatttcac aaggaacgag agcagccacc 900 

cagatttgca cagcctggct cctttgagta tgaatatgcc atgcgctgga aggcactcat 960 

tgagatggag aagcagcagc aggaccaagt ggaccgcaac atcaaggagg ctcgtgagaa 102 0 

gctggagatg gagatggaag ctgcacgcca tgagcaccag gtcatgctaa tgagacagga 1080 

tttgatgagg cgccaagaag aacttcggag gatggaagag ctgcacaacc aagaggtgca 114 0 

aaaacgaaag caactggagc tcaggcagga ggaagagcgc aggcgccgtg aagaagagat 12 00 

gcggcggcac gaagaagaaa tgatgcggcg acacgaggaa ggattcaagg gaaccttccc 12 60 

tgatgcgaga gagcaggaga ttcggatggg tcagatggct atgggaggtg ctatgggcat 1320 

aaacaacaga ggtgccatgc cccctgctcc tgtgccagct ggtaccccag ctcctccagg 13 8 0 
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acctgccact 


atgatgccgg atggaacttt gggattgacc 


ccaccaacaa 


ctgaacgctt 


1440 


tggtcaggct 


gctacaatgg aaggaattgg ggcaattggt 


ggaactcctc 


ctgcattcaa 


1500 


ccgtgcagct 


cctggagctg aatttgcccc aaacaaacgt 


cgccgatact 


aataagttgc 


1 C £ f\ 

1560 


agtgtctagt 


ttctcaaaac ccttaaaaga aggacccttt 


ttggactagc 


cagaattcta 


1620 


ccctggaaaa gtgttaggga ttccttccaa tagttagatc 


taccctgcct gtactactct 


1680 


aagggattcc 


ttccaatagt tagatctacc ctgcctgtac 


tactctaggg agtatgctgg 


1740 


aggcagaggg 


caagggaggg gtggtattaa acaatgcaat tctgtgtggt 


atattgttta 


1800 


atcagttctg 


tgtggtgcat tcctgaagtc tctaatgtga 


ctgttgaggg 


cctggggaaa 


1860 


ccatggcaaa 


gtggatccag ttagagccca ttaatcttga 


tcattccggt 


tttttttttt 


1920 


tttgtccatc 


ttgtttcatt tgcttgcccc gcccccgaga 


cggagtctta 


ctctgtcgcc 


1980 


caggctggag 


tgtagtggca tgatctcggc tcactgcaat ctctgcctcc 


cgggttcaag 


2040 


cttgtccagg ttgatcttga actcctgacc tcgtgatcta cccacctcgg tctcccaaaa 


2100 


tgctgggatt 


acaggggtga gccaccgtgc ccaacctcac 


ttgcttctta 


tccttacact 


2160 


cccccagccc 


cagagaaact gccacataca ccacaaaaac 


caaacatgcc 


ccaatgacct 


2220 


tagccccatt gctccattca ctcccaggtg agaattcagg caaacgtcca caaaggtcac 


2280 


aggcagcgta 


catacggttc tgttataccc catatattac 


cccttcatgt 


cctaaagaag 


2340 


acattttctc 


ttagagattt tcattttagt gtatctttaa 


aaaaaaaatc 


ttgtgttaac 


2400 


ttgcctccat 


ctttttcttg gggtgaggga caccagggaa 


tgaccctttt 


gtgtctatga 


2460 


tgttgctgtt 


cacagctttt cttgataggc ctagtacaat 


cttgggaaca 


gggttactgt 


2520 


atactgaagg 


tctgacagta gctcttagac tcgcctatct 


taggtagtca 


tgctgtgcat 


2580 


tttttttttc 


attggtgfcac tgtgtttgat ttgtctcata 


tatttggagt 


tfcttctgaaa 


2640 


aatggagcag 


taatgcagca tcaacctatt aaaatacttt 


taagcctttt 




2690 



<210> 25 

<211> 1828 

<212> DNA 

<213> Homo sapiens 

<400> 25 

cagttacagg gagcaccacc agggaacatc tcggggagcc tggttggaag ctgcaggctt 6 0 

agtctgtcgg ctgcgggtct ctgactgccc tgtggggagg gtcttgcctt aacatccctt 12 0 

gcatttggct gcaaagaaat ctgcttggaa gaaggggtta cgctgtttgg ccgggcagaa 180 

actccgctga gcagaacttg ccgccagaat gctcctcctg ttgctgagta tcatcgtcct 240 

ccacgtcgcg gtgctggtgc tgctgttcgt ctccacgatc gtcagccaat ggatcgtggg 3 00 
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caatggacac gcaactgatc tctggcagaa ctgtagcacc tcttcctcag gaaatgtcca 3 60 

. CCa ^ t ? t 5 tc tcatcatc . ac .^ a . a . ac §T aa t3 gctasagtct gtccaggcca ccatgatcct 420 

gtcgatcatc ttcagcattc tgtctctgtt cctgttcttc tgccaactct tcaccctcac 48 0 

caaggggggc aggttttaca tcactggaat cttccaaatt cttgctggtc tgtgcgtgat 54 0 

gagtgctgcg gccatctaca cggtgaggca cccggagtgg catctcaact cggattactc 600 

ctacggtttc gcctacatcc tggcctgggt ggccttcccc ctggcccttc tcagcggtgt 660 

catctatgtg atcttgcgga aacgcgaatg aggcgcccag acggtctgtc tgaggctctg 72 0 

agcgtacata gggaagggag gaagggaaaa cagaaagcag acaaagaaaa aagagctagc 78 0 

ccaaaatccc aaactcaaac caaaccaaac agaaagcagt ggaggtgggg gttgctgttg 840 

attgaagatg tatataatat ctccggttta taaaacctat ttataacact ttttacatat 900 

atgtacatag tattgtttgc tttttatgtt gaccatcagc ctcgtgttga gccttaaaga 960 

agtagctaag gaactttaca tcctaacagt ataatccagc tcagtatttt tgttttgttt 1020 

tttgtttgtt tgttttgttt tacccagaaa taagataact ccatctcgcc ccttcccttt . 108 0 

catctgaaag aagatacctc cctcccagtc cacctcattt agaaaaccaa agtgtgggta 1140 

gaaaccccaa atgtccaaaa gcccttttct ggtgggtgac ccagtgcatc caacagaaac 1200 

agccgctgcc cgaacctctg tgtgaagctt tacgcgcaca cggacaaaat gcccaaactg 1260 

gagcccttgc aaaaacacgg cttgtggcat tggcatactt gcccttacag gtggagtatc 1320 

ttcgtcacac atctaaatga gaaatcagtg acaacaagtc tttgaaatgg tgctatggat 1380 

ttaccattcc ttattatcac taatcatcta aacaactcac tggaaatcca attaacaatt 144 0 

ttacaacata agatagaatg gagacctgaa taattctgtg taatataaat ggtttataac 1500 

tgcttttgta cctagctagg ctgctattat tactataatg agtaaatcat aaagccttca 1560 

tcactcccac atttttctta cggtcggagc atcagaacaa gcgtctagac tccttgggac 162 0 

cgtgagttcc tagagcttgg ctgggtctag gctgttctgt gcctccaagg actgtctggc 168 0 

aatgacttgt attggccacc aactgtagat gtatatatgg tgcccttctg atgctaagac 1740 

tccagacctt ttgtttttgc tttgcatttt ctgattttat accaactgtg tggactaaga 18 00 

tgcattaaaa taaacatcag agtaactc 182 8 

<210> 26 

<211> 500 

<212> DNA 

<213> Homo sapiens 



<400^ 26 

gctctcagag gcagcgtgcg ggtgtgctct ttgtgaaatt ccaccatggc gtaccgtggc 



60 
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cagggtcaga aagtgcagaa ggttatggtg cagcccatca acctcatctt cagatactta 120 

caaaatagat cgcggattca ggtgtggctc tatgagcaag tgaatatgcg gatagaaggc 1.80 

tgtatcattg gttttgatga gtatatgaac cttgtattag atgatgcaga agagattcat 240 

tctaaaacaa agtcaagaaa acaactgggt cggatcatgc taaaaggaga taafcattact 3 00 

ctgctacaaa gtgtctccaa ctagaaatga tcaatgaagt gagaaattgt tgagaaggat 3 60 

acagtttgtt tttagatgtc ctttgtccaa tgtgaacatt tattcatatt gttttgatta 420 

ccctcgtgtt actacaagat ggcaataaat actatgggat tgtttgtatt aaaaaattta 480 

cattgcttct taaaaaaaaa 500 

<210> 27 

<211> 4661 

<212> DNA 

<213> Homo sapiens 

<400> 27 

gctggacttg cctgcggtga cacctgctcc cctctgagag cttcaggttc tccggcctgc 60 

cttcactggt ttgtgtccag agccggactg attctctcaa tttgcgatct tcagcctgtt 12 0 

aaacaagaaa acgaaaaacc ccttccagaa aacatggatg catttgaaaa agtgagaaca 180 

aaattagaaa cacagccaca agaagaatat gaaatcatca atgtggaagt taaacatggt 24 0 

ggttttgttt attaccaaga aggttgttgc ttggttcgtt ccaaagatga agaagcagac 3 00 

aatgataatt atgaagtttt attcaatttg gaggaactta agttagacca gcccttcatt 3 60 

gattgtatca gagttgctcc agatgaaaaa tatgtggctg ccaagataag aactgaagat 420 

tctgaagcat ctacctgtgt aattataaag ctcagcgatc agcccgtaat ggaagcttct 4 80 

ttcccgaatg tgtccagttt tgaatgggta aaggacgagg aagatgaaga tgttttattc 54 0 

tacaccttcc agaggaacct tcgctgtcat gacgtatatc gagccacttt tggtgataac 600 

aaacgtaatg aacgctttta cacagaaaaa gacccaagct actttgtttt cctttatctt 660 

acaaaagaca gtcgtttcct caccataaat attatgaaca agactacttc tgaagtgtgg 720 

ttgatagatg gcctgagccc ttgggaccca ccagtactta tccagaagcg aatacatggg 78 0 

gtcctttact atgttgaaca cagagatgat gaattataca ttctcactaa tgttggagaa 840 

cctacagaat ttaagctaat gagaacagcg gctgataccc ctgcaattat gaattgggat 900 

ttatttttta caatgaagag aaafcacaaaa gtgatagact tggacatgtt taaggatcac 960 

tgtgttctat ttctgaagca cagcaatctc ctttatgtta atgtgattgg tctggctgat 102 0 

gattcagttc ggtctctaaa gctccctcct tgggcctgtg gattcataat ggatacaaat 1080 

tctgacccaa agaactgccc ctttcaactt tgctctccaa tacgtccccc aaaatattac 114 0 
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acatacaagt ttgcagaagg caaactgttt gaggaaactg ggcatgaaga cccaatcaca 1200 

aagactagtc gcgttttacg tctagaagcc, aaaagcaagg atgg.aaa^Ut .agtgccaatg ...1260 

actgttttcc acaaaactga ctctgaggac ttgcagaaga aacctctctt ggtacatgta 132 0 

tatggagctt atggaatgga tttgaaaatg aatttcaggc ctgagaggcg ggtcctggtg 13 80 

gatgatggat ggatattagc atactgccat gttcgaggtg gtggtgagtt aggcctccag 1440 

tggcacgctg atggccgcct aactaaaaaa ctcaatggcc ttgctgattt agaggcttgc 1500 

attaagacgc ttcatggcca aggcttttct cagccaagtc taacaaccct gactgctttc 1560 

agtgctggag gggtgcttgc aggagcattg tgtaattcta atccagagct ggtgagagcg 1620 

gtgactttgg aggcaccttt cttggatgtt ctcaacacca tgatggacac tacacttcct 168 0 

ctgacattag aagaattaga agaatggggg aatccttcat ctgatgaaaa acacaagaac 1740 

tacataaaac gttactgtcc ctatcaaaat attaaacctc agcattatcc ttcaattcac 1800 

ataacggcat atgaaaacga tgaacgggta cctctgaaag gaattgtaag ttatactgag 1860 

aaactcaagg aagccatcgc ggagcatgct aaggacacag gtgaaggcta tcagacccct 1920 

aatattattc tagatatfcca gcctggaggc aatcatgtaa ttgaggattc tcacaaaaag 198 0 

attacagccc aaattaaatt cctgtacgag gaacttggac ttgacagcac cagtgttttc 2040 

gaggatctta agaaatacct gaaattctga aacactgcat tcaactggga attggaaaca 2100 

cactgaaata tttcatagtc ttacttccaa ttgagttagc aaaaaaaaaa ttaataactt 2160 

gagactttta agttattaat tttttaaaat gtgcttctcc atctaaattt tgcttagtct 2220 

acatctcact tgcttatact attcctccat tgatgcacat gcccattaac ctaggaaagt 228 0 

agttttcaaa tcatgctcct tagaaggatg tggagtagag ggaagggaag gattggtgat 2340 

agcagagctc caggcctccc ttccagtcag aacagttgag cagtttacaa attagtgtcc 24 0 0 

tgcctctttg ctagcaaatg cttttagaca ctgtggcagt gagtcatcct ctaatttcta 2460 

tgactgcatt ttaagggaaa agataaaatt cttcccctta aaattcgtta aagtttttga 2520 

ataatctggg gtcctaatgt gttctggtca tccctgattg atgctatctg aataaagtta 258 0 

taagctccta taagccataa tttactttta aacattttat ttttttcaaa acatttgaga 2640 

acctttctta aagcggttac attcaagcta cagaaatatc gaagaattaa tgafctgttca 2700 

ccaagcagca tgctgtacat gaagctatta caaatgctta caatcccact gaaatgccag 2760 

tgtcttcatc tcttcataaa ggtgcctaac acgaggtata cagtatgttc agtacactgg 2820 

aatagcatgc tcgattggaa acaaagcatc tatctctgaa agctgtttgg cgatgaagga 2880 

gattcttcgt gttgtgttca aagatgagtc cctctccctt gtccagaaaa atgccacttg 2940 

tatcaacttt actgcctttg tcggcagaat tggtacttaa ccttattctt attttagcgg 3000 
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gaaggcccga 


aatcatatta 


tgtagattta 


acagtgttga 


ttctccaaaa 


ttcagaacca 


3060 


cgataaagat 


tctgtcgatg 


ccatccagct 


ctcttgtgta 


cacaacatag 


tggctgtcat 


3120 


tcctcaaatg 


gcaaaaccag 


cccctgttga 


ggagtagctc 


attggcatga 


agtagactta 


3180 


aatcttgata 


taacttcaaa 


gccgatctgg 


gctgagtctt 


ttggacctat 


ttttttaaaa 


3240 


aagtatttac 


gtaagtgttt 


gattctaaga 


attgtttgta 


agtattttta 


atatattgta 


3300 


aggagttatt 


tacccaaaac 


acttgctcca 


attttgcccc 


ttataattgc 


caaattgtaa 


3360 


gcatcaataa 


gtaggtaaga 


acaatttata 


taaaaactga 


tagaaatgac 


aaattcgggg 


3420 


tttcggcttg 


tccgggagtc 


aataagtacg 


cacagtgctc 


tgctacattg 


tagagtttct 


3480 


gtagagatca 


aatttgactc 


cactttagga 


gtcccaaagc 


aaatgtccat 


gtctaagatg 


3540 


aatatttaac 


ttgcatagtc 


attctgtgct 


atattgtaac 


tgccagatgg 


ccagaaagaa 


3600 


ggcaacagtg gactcagact 


tctgaggaat 


ttgggtttgt 


tcccctttgt 


agactaatgt 


3660 


gtaggttgct 


gttgtgcgaa 


gatcgtgtaa 


ctttagcaga 


catgtatttc 


ttgcacagct 


3720 


aatagaagac 


aaagttgaaa 


aaaaggatgc 


aaaataaaaa 


gctgcctaag 


gtgaaagtta 


3780 


gaaattgtag 


actttttttt 


accataatag 


tatgtgttca 


ttgaagatga 


tttgggttta 


3840 


ttttacagct 


atataaaaca 


taatttgatg 


atgtacfctct 


aacctttcaa 


gcattttctg 


3900 


ttattgacta 


tataatatag 


cctccataaa 


tgtttttaat 


gacaatattc 


tgttgaacgg 


3960 


ttgtaccata 


ctcagccatg 


ccctttcatt 


ttgacgatag 


tgtttctaat 


attttgtatt 


4020 


tttattcccc 


tccccccatt 


tttgtattac 


ttaagataga 


ttatcagaaa 


gacagttact 


4080 " 


ttgtcaaaga gtatgggcac 


ttgatacata 


atgccaaatt 


attcttcata 


agagctgttg 


4140 


ccaaatcagt 


gataatgttc 


atttaattgt 


attcttgcca 


gccatgttta 


ctggggtgat 


4200 


agttgttatt 


gtggttgtta 


ttgttcttta 


ggggtaggtt 


cccaatatgt 


ggtctttaaa 


4260 


taattatcta 


atggtgttta 


aaaagatgtt 


tattctgttt 


gtcaggtaca 


aagatattta 


4320 


tgatacatgt 


atgacttgtc 


taagttatta 


acattttctc 


tagccttagg 


taatgcatga 


'4380 


aagcacatgt 


ttcagtgcca 


ctcacataag 


aagtgcccgg 


taagtgttag 


ctattattgt 


4440 


ctacttgagt 


tactactttc 


taaaagtatg 


ttgaagtctt 


tttctgtaat 


tgcagatttg 


4500 


ttgattttgc 


atttgagtat 


tttctatatt 


ttgaagctgt 


tagatgcata 


gtcatgattt 


4560 


ttggtggaat 


gttttatcaa 


tttttgaaaa 


ttgcctttgt 


ctcatataat 


gcttttcata 


4620 


ttgaactata 


ttttgtctgc 


tattaaatac 


ttccaagcct 


g 




4661 



<210> 28 
<211> 1135 
<212> DNA 



IfcU depot 
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<213> Homo sapiens 



<400> 28 
ygacccggca 


acgaaggtac 


catggccgga 


ctccggagcc 


gcacaaacca 


gggctcgcca 


60 


uy aagc cay g 


attcagtccc 


cgtgggggtg 


gctttggcgg 


ccgagggggc 


tttggtgacc 


120 


gtggtggtcg 


tggaggccga 


gggggctttg 


gcgggggccg 


aggfccgaggc 


ggaggcttta 


180 


gaggtcgtgg 


acgaggagga 


ggtggaggcg 


gcggcggcgg 


tggaggagga 


ggaagaggtg 


240 


gtggaggctt 


ccattctggt 


ggcaaccggg 


gtcgtggtcg 


gggaggaaaa 


agaggaaacc 


300 


agtcggggaa 


gaatgtgatg 


gtggagccgc 


atcggcatga 


gggtgtcttc 


atttgtcgag 


360 


gaaaggaaga 


tgcactggtc 


accaagaacc 


tggtccctgg 


ggaatcagtt 


tatggagaga 


420 


agagagtctc 


gatttcggaa 


ggagatgaca 


aaattgagta 


ccgagcctgg 


aaccccttcc 


480 


gctccaagct 


agcagcagca 


atcctgggtg 


gtgtggacca 


gatccacatc 


aaaccggggg 


540 


ctaaggttct 


ctacctcggg 


gctgcctcgg 


gcaccacggt 


ctcccatgtc 


tctgacatcg 


600 


ttggtccgga 


tggtctagtc 


tatgcagtcg 


agttctccca 


ccgctctggc 


cgtgacctca 


660 


ttaacttggc 


caagaagagg 


accaacatca 


ttcctgtgat 


cgaggatgct 


cgacacccac 


720 


acaaataccg 


catgctcatc 


gcaatggtgg 


atgtgatctt 


tgctgatgtg 


gcccagccag 


780 


accagacccg 


gattgtggcc 


ctgaatgccc 


acaccttcct 


gcgtaatgga 


ggacactttg 


• 840 


tgatttccat 


taaggccaac 


t cr cat fcoracfc 




cty ^ — y ay y 
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QrtA 

y uu 


ccgaagtgaa 


aaagatgcaa 


caggagaaca 


tgaagccgca 


ggagcagttg 


acccttgagc 


960 


catatgaaag 


agaccatgcc 


gtggtcgtgg 


gagtgtacag 


gccacccccc 


aaggtgaaga 


1020 


actgaagttc 


agcgctgtca 


ggattgcgag 


agatgtgtgt 


tgatactgtt 


gcacgtgtgt 


1080 


ttttctatta 


aaagactcat 


ccgtcaaaaa 


aaaaaaaaaa 


aaaaaaaaaa 


aaaaa 


1135 


<210> 29 

<211> 6734 

<212> DNA 

<213> Homo sapiens 












<400> 29 
cccagttgtc 


tgcgggctgc 


ggggagctaa 


gtccccagat 


tggaggaggc 


tggctctggt 


60 


cttcgatgca 


caggagtggc 


cgttatggaa 


cgcagcagca 


gcgtgcaggg 


tcaaagacag 


120 


ccggcccccc 


atgtcagtgg 


tctaggatgg 


ccagtgaagg 


caccaacatc 


ccaagtcctg 


180 


tggtgcgcca 


gattgacaag 


cagtttctga 


tttgcagtat 


atgcctggaa 


cggtacaaga 


240 


atcccaaggt 


tctcccctgt 


ctgcacactt 


tctgcgagag 


gtgcctgcag 


aactacattc 


300 


ctgcccacag 


tttaaccctc 


tcctgcccag 


tgtgccgcca 


gacctccatc 


ctgcccgaga 


360 


aaggggtggc 


cgcgctccag 


aacaatttct 


tcatcacaaa 


cctgatggac 


gtgctgcagc 


420 
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gaactccagg 


cagcaacgct 


gaggagtctt 


ccatcctgga 


gacagtcact 


gctgtggctg 


480 


cgggaaagcc 


tctctcttgc 


ccaaaccacg 


atgggaatgt 


gatggaattt 


tactgccagt 


540. 


cctgtgagac 


tgccatgtgt 


cgggagtgca 


cggaggggga 


gcacgcagag 


caccccacag 


600 


ttccactcaa 


ggatgtggtg gaacagcaca 


aggcctcgct 


ccaggtccag 


ctggatgctg 


660 


tcaacaaaag 


gctcccagaa atagattctg 


ctcttcagtt 


catctctgaa 


atcattcatc 


720 


agttaaccaa 


ccaaaaggcc 


agcatcgtgg 


atgacattca 


ttccaccttt 


gatgagctcc 


780 


agaagacttt 


aaatgtgcgc 


aagagtgtgc 


tgcttatgga 


attggaggtc 


aactatggcc 


840 


tcaaacacaa 


agtcctccag 


tcgcagctgg 


atactctgct 


ccaggggcag 


gagagcatta 


900 


agagctgcag caacttcaca gcgcaggccc 


tcaaccatgg 


cacggagacc 


gaggtcctac 


960 


tggtgaagaa 


gcagatgagc 


gagaagctga 


acgagctggc 


cgaccaggac 


ttccccttgc 


1020 


acccgcggga 


gaacgaccag 


ctggatttca 


tcgtggaaac 


cgaggggctg 


aagaagtcca 


1080 


tccacaacct 


cgggacgatc 


ttaaccacca 


acgccgttgc 


ctcagagaca 


gtggccacgg 


1140 


gcgaggggct 


gcggcagacc 


atcatcgggc 


agcccatgtc 


cgtcaccatc 


accaccaagg 


1200 


acaaagacgg 


tgagctgtgc 


aaaaccggca 


acgcctacct 


caccgccgaa 


ctgagcaccc 


1260 


ccgacgggag 


cgtggcagac 


ggggagatcc 


tggacaacaa 


gaacggcacc 


tatgagtttt 


1320 


tgtacactgt 


ccagaaggaa 


ggggacttta 


ccctgtctct 


gagactctat 


gaccagcaca 


1380 


tccgaggcag 


cccgfcttaag 


ctgaaagtga 


tccgatccgc 


tgatgtgtct 


cccaccacag 


1440 


aaggcgtgaa 


gaggcgcgtt 


aagtccccgg 


ggagcggcca 


cgtcaagcag 


aaagctgtga 


1500 


aaagacccgc 


aagcatgtac 


agcactggaa 


aacgaaaaga 


gaatcccatc 


gaagacgatt 


1560 


tgatctttcg agtgggtacc aaaggaagaa 


ataaaggaga 


gtttacaaat 


cttcaggggg 


1620 


tagctgcatc 


tacaaatgga 


aagatattaa 


ttgcagacag 


taacaaccaa 


tgtgtgcaga 


1680 


tattttccaa 


tgatggccag 


ttcaaaagtc 


gttttggcat 


acggggacgc 


tctccggggc 


1740 


agctgcagcg 


gcccacagga 


gtggctgtac 


atcccagtgg 


ggacataatc 


attgccgatt 


1800 


atgataataa 


atgggtcagc 


attttctcct 


ccgatgggaa 


atttaagaca 


aaaattggat 


1860 


caggaaagct 


gatgggaccc 


aaaggagttt 


ctgtggaccg 


caatgggcac 


attattgttg 


1920 


tggacaacaa 


ggcgtgctgc 


gtgtttatct 


tccagccaaa 


cgggaaaata 


gtcaccaggt 


1980 


ttggtagccg 


aggaaatggg 


gacaggcagt 


ttgcaggtcc 


ccattttgca 


gctgtaaata 


2040 


gcaataatga 


gat tat tat t 


acagatttcc 


ataatcattc 


tgtcaaggtg 


tttaatcagg 


2100 


aaggagaatt 


catgttgaag 


tttggctcaa 


atggagaagg 


aaatgggcag 


tttaatgctc 


2160 


caacaggtgt 


agcagtggat 


tcaaatggaa 


acatcattgt 


ggccgactgg 


ggaaacagca 


2220 
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ggatccaggt ttttgatggg agtggatcat ttttgtccta cattaacaca tctgctgacc 22 80 
cactctatgg cccccaaggc_ 9t3sgocta^cttc%g^tgg .fccatgttgtg .gttgcagact . 234-a 

ctggaaatca ctgtttcaaa gtctatcgat acttacagta atggtgggca ggtggatacc 24 00 

cgcttccatg gtcttgcact ataaactgga atggatttct caatgcggga ccagattatg 2460 

actagagttt ttatgccaga aggaatcatt ggtgaacttt ccaaggttat ttctgaatgt 2 520 

aacaatttcc ttaaaaatga cttatccaat ttctgtattt cacctttagg gttaaaaaaa 2580 

actcttctac tgaatctata aaaactgcag ttttacatct gtgaactatg gcttaaggga 2 640 

caggatttat gtagctaaac taattttgca aatcaaacag acacttaaaa aaactagcat 2700 

atgtaaaggt attcgttaat cctgtgaatg gtagcttttg cacagaactt ccaaaagcaa 2760 

aacaaaaaca aaatctattg tagttatata cttcatttaa cctaggtcac aagacccagg 2820 

gaatcttcta acctcacttt tacagtaggt attactcttg tgacattttt ttggttatca 28 80 

acaactaaat ataaattact ttggaaaaag taaggctgtc ttgcaaaatg atcccagctc 2 94 0 
tgattagcag ccctctggag ttcagaactt aagtatcagt gcaaatttct caacctttct . 3 0 00 

gggttagaca aagatccttt tttgtgtgtt cttttcacca cccctttggc tcaccttgta 3 060 

tcagcaaaca aagtacttct tcagggaaac ctgaaatttc taatgccttg aaaagcatat 312 0 

tacaaaagta atgctacctt ttgggaaaca aactgccccg ttaactccag atcattgcac 3180 

tggaatgtaa tcaagaaagt tagtcatgtt ttatgtacca tgttttcaca cgtgtctctt 3240 

ctcttcgact tcctgaaagc gaaagcttta cctcctgcaa atgtcagcac atgtagtagg 3 3 00 

acaccagtat cctaggacag agagccataa gtagcccttt ggaggactga tggtgtcaac 3360 

caaaggcatg tgattgatta atgattcccc cttagaaagc aagtgttacc aaagttgtgt 3 420 

tatcttgaaa gcattacagg taagggcatg ttatggttafc ttatcattgt ttaatgaata 34 8 0 

gtagaggtgt caagggacta tgtatacatg attagggtaa gatagaatgt attatatata 3540 

tatatatata tacacacaca catatatata gctgaatctt tggtgfcattg aaataggcag 3 60 0 

cactctgaaa gacagaagct tcgtccagcc actcttcagc acattccttt actaagcagt 3 660 

ttaaagccgt cctagtggag caagccctaa agcagattta atttttgcca ttttccaaga 3720 

atgacggtgg tggcttttag tcagaaaatg gccttctgtg ctttcaaaaa aaaaacaaaa 3 78 0 

aaaaaaccac acacacacat aaaaaaccca acaggtcaaa ataaaagttg aacttgagtt 3 84 0 

acatttaatt taaatataaa tgcattttga gaaatgttaa gaacaattta gtcaatcgtt 390 0 

catctgtcat tggtactgta aaataagctg tggtctattt ccactgttta attttctact 3 9 60 

cagttctacc aaataggatg tcatgtttga catttttgat agtgactttg gggtcttctt 4 02 0 

cactgaaagc accttagaac tgtactataa gaaaacattt cccctatgta taattatatg 4080 
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aatgtgatgt ttattgctta ttaatttata attcagtcat tctctatata ggacttctta 4140 

aaatttagaa gggaaatcta gctacttcaa attgtctgtt aaatttatta tgcccaaatc 4200 

aacctctgaa aaaaggtttt tccaggaaga tttacattta ggtttaatat ttttttagtt 4260 

aggtagagtt ttaaaaaata cttgagcctg tccgtgataa agctataaaa ttcaataact 4320 

ttttagaatg ttaaatgaag acactgtttc ctaacatcag tgagatacat ctttgaattt 4380 

aaacattcat atttactgag tacctactag gtaccaagta ctcttttagg cactggaaat 444 0 

acagtgatgg acaaaacagg taaaaaatcg ctgccccctc agagctgaca ttctggggtg 4 500 

ggaatttcat tttgccacgt actaacgttc tgcacaaaag acaggctaga ctcttgtcta 4560 

gattgtttaa aagaaacttt tcaaattggt tacattaatt ttagtttatt ttcacaagta 4 62 0 

aaaatggctt tttatttaga ttctttcfcgt cccaggctgt tgatcttaaa actagttgat 4 680 

ttaaagagtt tttttgcaca acatttcaat tatatttgtg aacttagaaa ttaacttaca 4740 

atctaaccag ccatcatatc atatcctatc aggctagata tctcaatagt agactgaata 4 800 

caaagctaat tttttttaca tgtcaatatt ggcacaaact ggaatgaaag aatagttbga 4860 

ttcagacctg ctccactatg tgttgctaaa acacatgcta tgagcactcg aggaaacact 4920 

atattttttc caaaaaatat gtgattatat atgttaaagt atagataaca tttcacactt 4980 

ggatacatat gtgcatttac tgtatttctt ggtaagcata tttttggggg aaagtgctgc 5040 

tgatatgata caagtagaca aaatttaaat gaaattttgt cacattctat ggaaaatggt 5100 

ttctggtaaa ctgagaagga tattaaaata agtggctttt ttctgggcta ccattattgt 5160 

ttgatttctc tttgtcaagt gtatagaacc tgtcatacat tcatgataag tagcactgaa 5220 

aaattactca ttcaaatttc ccctgggcac gtaaggcaaa atattgccgg ttgggatttc 5280 

aaggtcagtg acgacgcatt tcctcccagt acagaccccc cagcccccct tgctggacat 5340 

ggg<J a gg ca 9 agagtcactt gaccatccag aaatacatga ctacaagtcc tttatgactg 540 0 

tttgccattt tttttaatgg tacttagtat tttgatcaaa ctttagtctc cagaactaaa 5460 

caagtcccta agtttcctta ttttaattta ctgtgactag atttgaagca aataaatact 5520 

ccagatccat gcagctagaa cacacttgct tccactacta aatatacagg gtatgtccta 5580 

acatggagtt aactggaata gcagtacact agcaagtatc tgtgaatcct tagcactgac 5640 

gggttaacag aaatgctttg gtaataccta cttagttaat tggaggaagt agtaaataaa 5700 

cattaggtaa tctgcagatt acttcaaatg ggaaaaatct ttttgfcagac tctatagtac 5760 

cctctctatt cactagcttc tgaaaaggga ggagtatttt tagtttgaca atttaataat 5820 

ttaaaaacaa gacatctcca ggtaggaaaa" aatgaaagct atttcatgca aacattatct 58 8 0 
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aatttagctt 


aaaagtgaaa gtggtaatac tgttggtttc tgtaaatafct acaaaatttt 


*j ^ *at \J 


aaactttata 


attactttaa tatttttgat aactagaaat ctaatatJtac. cataaarrcraa 


fin nn 

- 0 u u u 


actaagtgcc 


catcaaagat ttgtttggta taaataaaga attatttgtt ttgttttcaa 


fi nfin 


tgacagtaag 


ctacaaatca tgatgcttaa aaactttcta aaaataaatt crfccrt-acrr'acTt- 


D X «s U 


gattggtcfcg 


tttgtggaga atcrfcatcraaa actattaata ttctaoaat-a erai-t-aat-Aaa 


O JLo U 


ttggctatgt 


tcifctccaatcr aafccrtacacrc acttrraffs ^nt-t-t-t-rr^^^ ar>aanar«arTn 


6240 


cttaaactca 


afcgcfcfcfcfccrc tt tat era. cat crcrcfaafccrfcfcc* fahrai-PA^t- nrra rrt-rrt* 


D jUU 


cttgtaatag 


aattcttfcat atcattctca atfcctafcacra ctttcaaacc t- ^ t- rrt- a t- rr^ ^ 


DO O U 


tatgaagggg 


tttttttttt fctfcacttfccrfc ttfccfcfcfcfcfca crat-M-tcrt-ar* ;3t-t-rT^>t- 


/r /i 0 r\ 
o4X U 


tataggtctg 


tttcatatcft tttatcrtata aaacactaaa t- r»t-t~ err* a nf n r^t-rm f- +- 


/" .1 0 A 

o4fe 0 0 


atactgatat 


u^i,v-u^yL,^a i.ciuyciciL.cc«.«. aaLyuLyacL gcccatutaa 


6540 


agaaaagaat 


gaacgctgtg catcaaagtg tttgtatgtt cgtagctaca tacgtaccac 


6600 


agtattttgg 


atgctttagt ctacaatgaa actttcaatt aattctgtct tgaaacatag 


6660 


gagaaacagg 


attcatgtgt atctctttac catgeacaaa atctcaaatc attataataa 


6720 


agcttgtttt 


ctcc 


6734 



<210> 30 

<211> 3744 

<212> DNA 

<213> Homo sapiens 




<400> 30 
ccacgcgtcc 


ggtggcggtc gagcgtggcg taggegaate ctcggcacta agcatatgga 


60 


cctcgcggcg 


geageggage cgggcgccgg cagccagcac ctggaggtcc gcgacgaggt 


120 


ggccgagaag 


tgecagaaac tgttcctgga cttcttggag gagtttcaga geagegatgg 


180 


agaaattaaa 


tacttgeaat tagcagagga actgattcgt cctgagagaa acacattggt 


240 


tgtgagtttt 


gtggacctgg aacaatttaa ccagcaactt tccaccacca ttcaagagga 


300 


gttctataga 


gtttaccctt acctgtgtcg ggccttgaaa acattegtea aagaccgtaa 


360 


agagatccct 


ettgecaagg atttttatgt tgcattccaa gacctgccta ccagacacaa 


420 


gattcgagag 


ctcacctcat ccagaattgg tttgetcact cgcatcagtg ggcaggtggt 


480 


gcggactcac 


ccagttcacc cagagcttgt gageggaact tttctgtgct tggactgtca . 


540 


gacagtgatc 


agggatgtag aacagcagtt caaatacaca cagccaaaca tetgecgaaa 


600 


tccagtttgt 


gecaacagga ggagattctt actggataca aataaatcaa gatttgttga 


660 


ttttcaaaag 


gttegtatte aagagaccca agctgagctt cctcgaggga gtatcccccg 


720 
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cagtttagaa gtaattttaa gggctgaagc tgtggaatca gctcaagctg gtgacaagtg 78 0 

tgactttaca gggacactga ttgttgtgcc tgacgtctcc aagcttagca caccaggagc 840 

acgtgcagaa actaattccc gtgtcagtgg tgttgatgga tatgagacag aaggcattcg 900 

aggactccgg gcccttggtg ttagggacct ttcttatagg ctggtctttc ttgcctgctg 960 

tgttgcgcca accaacccaa ggtttggggg gaaagagctc agagatgagg aacagacagc 1020 

tgagagcatt aagaaccaaa tgactgtgaa agaatgggag aaagtgtttg agatgagtca 1080 

agataaaaat ctataccaca atctttgtac cagcctgttc cctactatac atggcaatga 1140 

tgaagtaaaa cggggtgtcc tgctgatgct ctttggtggc gttccaaaga caacaggaga 1200 

agggacctct cttcgagggg acataaatgt ttgcattgtt ggtgacccaa gtacagctaa 1260 

gagccaattt ctcaagcacg tggaggagtt cagccccaga gctgtctaca ccagtggtaa 1320 

agcgtccagt gctgctggct taacagcagc tgttgtgaga gatgaagaat ctcatgagtt 13 80 

tgtcattgag gctggagctt tgatgttggc tgataatggt gtgtgttgta ttgatgaatt 144 0 

tgataagatg gacgtgcggg atcaagttgc tattcatgaa gctatggaac agcagaccat 1500 

atccatcact aaagcaggag tgaaggctac tctgaacgcc cggacgtcca ttttggcagc 1560 

agcaaaccca atcagtggac actatgacag atcaaaatca ttgaaacaga atataaattt 1620 

gtcagctccc atcatgtccc gattcgatct cttctttatc cttgtggatg aatgtaatga 168 0 

ggttacagat tatgccattg ccaggcgcat agtagatttg cattcaagaa ttgaggaatc 174 0 

aattgatcgt gtctattccc tcgatgatat cagaagatat cttctctttg caagacagtt 1800 

taaacccaag atttccaaag agtcagagga cttcattgtg gagcaatata aacatctccg 1860 

ccagagagat ggttctggag tgaccaagtc ttcatggagg attacagtgc gacagcttga 192 0 

gagcatgatt cgtctctctg aagctatggc tcggatgcac tgctgtgatg aggtccaacc 1980 

taaacafcgtg aaggaagctfc tccggttact gaataaatca atcatccgtg- tggaaacacc 2 04 0 

tgatgtcaat ctagatcaag aggaagagat ccagatggag gtagatgagg gtgccggtgg 2100 

catcaatggt catgctgaca gccctgctcc tgtgaacggg atcaatggct acaatgaaga 2160 

cataaatcaa gagtctgctc ccaaagcctc cttaaggctg ggcttctctg agtactgccg 2220 

aatctctaac cttattgtgc fctcacctcag aaaggtggaa gaagaagagg acgagtcagc 22 8 0 

attaaagagg agcgagcttg ttaactggta cttgaaggaa atcgaatcag agatagactc 2340 

tgaagaagaa cttataaata aaaaaagaat catagagaaa gttattcatc gactcacaca 2400 

ctatgatcat gttctaattg agctcaccca ggctggattg aaaggctcca cagagggaag 24 60 

tgagagctat gaagaagatc cctacttggt agttaaccct aactacttgc tcgaagattg 2520 

agatagtgaa agtaactgac cagagctgag gaactgtggc acagcacctc gtggcctgga 258 0 
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gcctggctgg 


agctctgcta 


gggacagaag 


tgtttctgga 


agtgatgctt 


ccaggatttg 


2640 


ttttcagaaa 


caagaattga 


gttgatggtc 


ctatgtgtca 


cattcatcac 


aggtttcata 


2700 


ccaacacagg 


cttcagcact 


tcctttggtg 


tgtttcctgt 


cccagtgaag 


ttggaaccaa 


2760 


ataatgtgta 


gtctctataa 


ccaatacctt 


tgttttcatg 


tgtaagaaaa 


ggcccattac 


2820 


ttttaaggta 


tgtgctgtcc 


tattgagcaa 


ataacttttt 


ttcaattgcc 


agctactgct 


2880 


tttattcatc 


aaaataaaat 


aacttgttct 


gaagttgtct 


attggatttc 


tttctactgt 


2940 


accctgatta 


ttacttccat 


ctacttctga 


atgtgagact 


ttcccttttt 


gcttaacctg 


3000 


gagtgaagag 


gtagaactgt 


ggtattatgg 


atgaggtttc 


tatgagaagg 


agtcattaga 


3060 


gaactcatat 


gaaagctaga 


ggccttagag 


atgactttcc 


aaggttaafct 


ccagtttttt 


3120 


ttttttttaa 


gtttataaaa 


gtttattata 


cttttttaaa 


attactcttt 


agtaatttat 


3180 


tttacttctg 


tgtcctaagg 


gtaatttctc 


aggattgttt 


tcaaattgct 


tttttagggg 


3240 


aaataggtca 


tttgctatat 


tacaagcaat 


ccccaaattt 


tatggtcttc 


caggaaaagt 


3300 


tattaccgtt 


tatgatacta 


acagttcctg 


agacttagct 


atgatcagta 


tgttcatgag 


3360 


gtggagcagt 


tcctgtgttg 


cagcttttaa 


caacagatgg 


cattcattaa 


atcacaaagt 


3420 


atgttaaagg 


tcacaaaagc 


aaaataactg 


tctgaggcta 


aggcccacgt 


gggacagtct 


3480 


aatacccatg 


agtactcaac 


ttgccttgat 


gtctgagctt 


tccagtgcaa 


tgtgaatttg 


3540 


agcagccaga 


aatctattag 


tagaaagcaa 


gacagattaa 


tataggttaa 


aacaatgatt 


3600 


taaatatgtt 


tctcccaata 


attatctctt 


tccctggaat 


caacttgtat 


gaaaccttgt 


3660 


caaaatgtac 


tccacaagta 


tgtacaatta 


agtattttaa 


aaataaatgg 


caaacattaa 


3720 


aaaaaaaaaa 


aaaaaaaaaa 


aaaa 








3744 


<210> 31 

<211> 3321 

<212> DNA 

<213> Homo sapiens 












<400> 31 
ttgtgagtct 


ataactcgga 


gccgttgggt 


cggttcctgc 


tattccggcg 


cctccactcc 


60 


gtcccccgcg ggtctgctct 


gtgtgccatg 


gacggcattg 


tcccagatat 


agccgttggt 


120 


acaaagcggg gatctgacga 


gcttttctct 


acttgtgtca 


ctaacggacc 


gtttatcatg 


180 


agcagcaact 


cggcttctgc 


agcaaacgga 


aatgacagca 


agaagttcaa 


aggtgacagc 


240 


cgaagtgcag 


gcgtcccctc 


tagagtgatc 


cacatccgga 


agctccccat 


cgacgtcacg 


300 


gagggggaag 


tcatctccct 


ggggctgccc 


tttgggaagg 


tcaccaacct 


cctgatgctg 


360 


aaggggaaaa 


accaggcctt 


catcgagatg 


aacacggagg 


aggctgccaa 


caccatggtg 


420 
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aactactaca cctcggtgac ccctgtgctg cgcggccagc ccatctacat ccagttctcc 480 

aaccacaagg agctgaagac cgacagctct cccaaccagg cgcgggccca ggcggccctg 540 

caggcggtga actcggtcca gtcggggaac ctggccttgg ctgcctcggc ggcggccgtg 600 

gacgcaggga tggcgatggc cgggcagagc cccgtgctca ggatcatcgt ggagaacctc 660 

ttctaccctg tgaccctgga tgtgctgcac cagattttct ccaagttcgg cacagtgttg 72 0 

aagatcatca ccttcaccaa gaacaaccag ttccaggccc tgctgcagta tgcggacccc 780 

gtgagcgccc agcacgccaa gctgtcgctg gacgggcaga acatctacaa cgcctgctgc 840 

acgctgcgca tcgacttttc caagctcacc agcctcaacg tcaagtacaa caatgacaag 900 

agccgtgact acacacgccc agacctgcct tccggggaca gccagccctc gctggaccag 96 0 

accatggccg cggccttcgg tgcacctggt ataatctcag cctctccgta tgcaggagct 102 0 

ggtttccctc ccacctttgc cattcctcaa gctgcaggcc tttccgttcc gaacgtccac 1080 

ggcgccctgg cccccctggc catcccctcg gcggcggcgg cagctgcggc ggcaggtcgg 1140 

atcgccatcc cgggcctggc gggggcagga aattctgtat tgctggtcag caacctcaac 1200 

ccagagagag tcacacccca aagcctcttt attcttttcg gcgtctacgg tgacgtgcag 1260. 

cgcgtgaaga tcctgttcaa taagaaggag aacgccctag. tgcagatggc ggacggcaac 1320 r 

caggcccagc tggccatgag ccacctgaac gggcacaagc tgcacgggaa gcccatccgc 13 80 L; 

atcacgctct. cgaagcacca gaacgtgcag ctgccccgcg agggccagga ggaccagggc 1440 -.r 

ctgaccaagg actacggcaa ctcacccctg caccgcttca agaagccggg ctccaagaac 1500^- 

ttccagaaca tattcccgcc ctcggccacg ctgcacctct ccaacatccc gccctcagtc 1560 

tccgaggagg atctcaaggt cctgttttcc agcaatgggg gcgtcgtcaa aggattcaag 1620 

ttcttccaga aggaccgcaa gatggcactg atccagatgg gctccgtgga ggaggcggtc 168 0 

caggccctca ttgacctgca caaccacgac ctcggggaga accaccacct gcgggtctcc 174 0 

ttctccaagt ccaccatcta ggggcacagg cccccacggc cgggccccct ggcgacaact 180 0 

tccatcattc cagagaaaag ccactttaaa aacagctgaa gtgaccttag cagaccagag 1860 

attttatttt tttaaagaga aatcagttta cctgttttta aaaaaattaa atctagttca 192 0 

ccttgctcac cctgcggtga cagggacagc tcaggctctt ggtgactgtg gcagcgggag 1980 

ttcccggccc tccacacccg gggccagacc ctcggggcca tgccttggtg gggcctgtgt 2040 

cgggcgtggg gcctgcaggt gggcgccccg accacgactt ggcttccttg tgccttaaaa 2100 

aacctgcctt cctgcagcca cacacccacc cggggtgtcc tggggaccca aggggtgggg 2160 

gggtcacacc agagagaggc agggggcctg gccggctcct gcaggatcat gcagctgggg 2220 
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cgcggcggcc gcggctgcga caccccaacc ccagccctct aatcaagtca cgtgattctc 2280 

CCttCaCCC ?. 3 cccc . ca 5?? ccttcccttc tg_cccccagg cgggctcpgp gctgctocag .2340. 

ctgcggagct ggtcgacata atctctgtat tatatacttt gcagttgcag acgtctgtgc 2400 

ctagcaatat ttccagttga ccaaatattc taatcttttt tcatttatat gcaaaagaaa 2460 

tagttttaag taacttttta tagcaagatg atacaatggt atgagtgtaa tctaaacfctc 2520 

cttgtggtat taccttgtat gchgttactt ttattttatt ccttgtaatt aagtcacagg 2580 

caggacccag tttccagaga gcaggcgggg ccgcccagtg ggtcaggcac agggagcccc 2640 

ggtcctatct tagagcccct gagcttcagg gaaggggcgg gcgtgtcgcc gcctctggca 2700 

tcgcctccgg ttgccttaca ccacgccttc acctgcagtc gcctagaaaa cttgctctca 2760 

aacttcaggg ttttttcttc cttcaaattt tggaccaaag tctcatttct gtgttttgcc 2820 

tgcctctgat gctgggaccc ggaaggcggg cgctcctcct gtcttctctg tgctctttct 2880 

accgcccccg cgtcctgtcc cgggggctct cctaggatcc cctttccgta aaagcgtgta 2940 

acaagggtgt aaatatttat aattttttat acctgttgtg agacccgagg ggcggcggcg . 3 000 

cggtttttta tggtgacaca aatgtatatt ttgctaacag caattccagg ctcagtattg 3 060 

tgaccgcgga gccacagggg accccacgca cattccgttg ccttacccga tggcttgtga 3120 

cgcggagaga accgattaaa accgtttgag aaactcctcc cttgtctagc cctgtgttcg 3180 

ctgtggacgc tgtagaggca ggttggccag tctgtacctg gacttcgaat aaatcttctg 3240 

tatcctcgct ccgttccgcc ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 33 00 

aaaaaaaaaa aaaaaaaaaa a 3321 

<210> 32 

<211> 1209 

<212> DNA 

<213> Homo sapiens 

<400> 32 

gaattcctga cttccttttc ggaggaagat ccttgagcag ccgacgttgg gacaaaggat 60 

ttggagaaac ccagggctaa agtcacgttt ttcctccttt aagacttacc tcaacactfcc 12 0 

actccatggc agttcccgag acccgcccta accacactat ttatatcaac aacctcaatg 180 

agaagatcaa gaaggatgag ctaaaaaagt ccctgtacgc catcttctcc cagtttggcc 24 0 

agatcctgga tatcctggta tcacggagcc tgaagatgag gggccaggcc tttgtcatct 3 00 

tcaaggaggt cagcagcgcc accaacgccc tgcgctccat gcagggtttc cctttctatg 3 60 

acaaacctat gcgtatccag tatgccaaga ccgactcaga tatcattgcc aagatgaaag 420 

gcaccttcgt ggagcgggac cgcaagcggg agaagaggaa gcccaagagc caggagaccc 48 0 



I fcJf Ufci[JUl 



52 

cggccaccaa gaaggctgtg caaggcgggg gagccacccc cgtggtgggg gctgtccagg 54 0 

ggcctgtccc gggcatgccg ccgatgactc aggcgccccg cattatgcac cacatgccgg 600 

gccagccgcc ctacatgccg ccccctggta tgatcccccc gccaggcctt gcacctggcc 660 

agatcccacc aggggccatg cccccgcagc agcttatgcc aggacagatg ccccctgccc 720 

agcctctttc tgagaatcca ccgaatcaca tcttgttcct caccaacctg ccagaggaga 78 0 

ccaacgagct catgctgtcc atgcttttca atcagttccc tggcttcaag gaggtccgtc 840 

tggtacccgg gcggcatgac atcgccttcg tggagtttga caatgaggta caggcagggg 90 0 

cagctcgcga tgccctgcag ggctttaaga tcacgcagaa caacgccatg aagatctcct 960 

ttgccaagaa gtagcacctt ttccccccat gcctgcccct tcccctgttc tggggccacc 1020 

cctttccccc ttggctcagc cccctgaagg taagtccccc cttgggggcc ttcttggagc 108 0 

cgtgtgtgag tgagtggtcg ccacacagca ttgtacccag agtctgtccc cagacattgc 114 0 

acctggcgct gttaggccgg aattaaagtg gctttttgag gtttggtttt tcacaaaaaa 120 0 

aaggaattc 1209 

<210> 33 

<211> 1432 

<212> DNA 

<213> Homo sapiens 

<400> 33 

gctgttcggc ctgcgtcgcfc ccgggagctg ccgacggacg gagcgccccc gcccccgccc 60 

ggccgcccgc ccgccgccgc catgcccttc tccaacagcc acaacgcact gaagctgcgc 120 

ttcccggccg aggacgagtt ccccgacctg agcgcccaca acaaccacat ggccaaggtg 18 0 

ctgacccccg agctgtacgc ggagctgcgc gccaagagca cgccgagcgg cttcacgctg 24 0 

gacgacgtca tccagacagg cgtggacaac ccgggccacc cgtacatcat gaccgtgggc 3 00 

tgcgtggcgg gcgacgagga gtcctacgaa gtgttcaagg atctcttcga ccccatcatc 3 60 

gaggaccggc acggcggcta caagcccagc gatgagcaca agaccgacct caaccccgac 42 0 

aacctgcagg gcggcgacga cctggacccc aactacgtgc tgagctcgcg ggtgcgcacg 480 

ggccgcagca tccgtggctt ctgcctcccc ccgcactgca gccgcgggga gcgccgcgcc 540 

atcgagaagc tcgcggtgga agccctgtcc agcctggacg gcgacctggc gggccgatac 600 

tacgcgctca agagcatgac ggaggcggag cagcagcagc tcatcgacga ccacttcctc 660 

ttcgacaagc ccgtgtcgcc cctgctgctg gcctcgggca tggcccgcga ctggcccgac 720 

gcccgcggta tctggcacaa tgacaataag accttcctgg tgtgggtcaa cgaggaggac 78 0 

cacctgcggg tcatctccat gcagaagggg ggcaacatga aggaggtgtt cacccgcttc 84 0 
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tgcaccggcc tcacccagat tgaaactctc ttcaagtcta aggactatga gttcatgtgg 900 

aaccctcacc tgggctacat cctcacctgc ccatccaacc tgggcaccgg„gctgcgggca 96a 

ggtgtgcata tcaagctgcc caacctgggc aagcatgaga agttctcgga ggtgcttaag 1020 

cggctgcgac ttcagaagcg aggcacaggc ggtgtggaca cggctgcggt gggcggggtc 1080 

ttcgacgtct ccaacgctga ccgcctgggc ttctcagagg tggagctggt gcagatggtg 1140 

gtggacggag tgaagctgct catcgagatg gagcagcggc tggagcaggg ccaggccatc 1200 

gacgacctca tgcctgccca gaaatgaagc ccggcccaca cccgacacca gccctgctgc 1260 

ttcctaactt attgcctggg cagtgcccac catgcacccc tgatgttcgc cgtctggcga 1320 

gcccttagcc ttgctgtaga gacttccgtc acccttggta gagtttattt ttttgatggc 13 8 0 

taagatactg ctgatgctga aataaactag ggttttggcc tgcctgcgtc tg 1432 

<210> 34 

<211> 3309 

<212> DNA 

<213> Homo sapiens 

<400> 34 

gcggcgcgcc cgagcctagt ccccacgccg cggcgcgccc gggctccctg ctgatcccag 60 

aacaatcaac catgacgacc gaatctggat cagactcgga atccaagccg gaccaggagg 12 0 

ccgagcccca ggaggcggcg ggggcgcagg ggcggcgggg gccgtgccgg agccgcccaa 180 

ggaggagcag cagcaggccc tggagcagtt cgccgccgct gcagcgcaca gcaccccggt 240 

gcgagggagg tcactgacaa ggaacaggag tttgctgcca gggctgcaaa acagctcgaa 3 00 

tatcagcaat tagaagacga taaactttct cagaaatcat ctagcagtaa actctctcgg 3 60 

tctccattaa agattgtcaa aaagcctaaa agcatgcagt gcaaagtgat acttctcgat 420 

ggatcagaat atacctgtga tgtagagaaa cgctccagag gacaagtgct gtttgataaa 480 

gtgtgtgaac acttgaactt gctagagaaa gactactttg ggcttacgta tcgagatgct 540 

gaaaaccaga agaattggtt ggaccctgct aaggaaataa aaaaacaggt tcgaagtggt 600 

gcttggcact tttcatttaa tgtgaaattt tatccaccag accctgccca actatctgaa 660 

gatatcacca ggtactacct ctgcttgcag ttgcgagatg acatcgtgtc cggaaggctg 720 

ccctgctcct ttgttaccct ggccttgctg ggctcctaca ctgtccagtc agagctcgga 78 0 

gactatgacc cagatgaatg tgggagcgat tacattagtg agttccgctt tgcaccaaac 84 0 

cacactaaag aactggaaga caaagtgatc gagctgcaca agagccacag aggaatgacg 90 0 

ccagcagaag cagagatgca tttcttggaa aatgccaaaa aattatcaat gtatggggta 96 0 

gatttacatc atgctaagga ctcagaaggg gtagaaatta tgttaggagt ttgtgcaagt 1020 
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ggtctgttga tatatcgcga ccggctgcga ataaacagat ttgcctggcc caaggttcta 108 0 

aagatttcat acaaacggaa caacttttac attaagatcc ggccgggaga gtttgaacaa 114 0 

tttgaaagca ccattgggtt taagctgcca aaccatcgag ctgccaagcg tttatggaaa 1200 

gtatgtgttg agcatcatac atttttcaga ctactgttac cagaagcacc tcccaagaaa 1260 

ttcctaacct tgggttccaa gtttcgttat agtggcagga cacaagcgca aacgagaaga 1320 

gccagtgcgt tgatagatcg cccagcacct tactttgaac gctcatccag caaacgttat 13 80 

accatgtctc gcagcttgga tggagcatca gtgaatgaaa accatgaaat atacatgaag 1440 

gattctatgt ctgctgcaga ggttggtact ggccagtacg ccacaacaaa aggcatctct 1500 

cagaccaact tgatcaccac tgtgactccg gagaagaagg ctgaggagga gcgggacgag 1560 

gaagaggaca aacggaggaa gggggaagaa gtcacgccca tctcggccat ccagcacgag 1620 

ggaaagactg acagtgagcg cacggacacc gcagccgacg gggagaccac tgccactgag 168 0 

gagctagaaa aaactcaaga tgacctgatg aaacatcaaa ccaacattag cgagctgaaa 1740 

agaaccttct tagaaacctc aacagacact gccgtaacga atgaatggga gaagaggctt 1800 

tccacctccc ccgtgcgact ggccgccagg caggaggatg cccccatgat cgaaccactt 18 60 

gtccctgaag agaaaatgga aaccaagacg gagtccagtg gatagagacg gaacccaccg 1920 

tgcaccacct gccgcttagc actgagaagg tggtgcagga gaccgtgttg gtggaggagc 19 80. 

ggcgtgtggt gcacgcgagt ggggatgctt cttactcggc gggagacagc ggggafcgctg 2040* 

cagcacagcc cgcattcaca ggcattaaag ggaaagaggg ctctgcttga cggagggggc 2100'- '* 

taaagaggaa ggaggggagg aggtcgctaa agctgtcctg gaacaggaag agacagccgc 216 0^ ♦ 

tgcttcccgt gagcgacaag aggagcagag tgcagccatc cacatttcag aaactttgga 222 0 

acaaaaacct cattttgagt cctcaacggt gaagacggaa accatcagtt ttggcagtgt 22 8 0 

ttcaccggga ggagtaaagc tagaaatttc cacaagaagt gccagtagtt cacaccgaaa 234 0 

ccaaaaccat cacatatgaa tcatcacagg tcgatccagg cacagatctg gagccaggcg 2400 

tgctgatgag tgcacagacg atcacatctg aaaccaccag taccaccacc actacccaca 2460 

tcaccaaaac tgtgaaaggg ggcatttcag agacaagaat tgagaagcga atagtcatca 252 0 

cgggggatgc agacattgac catgaccagg cgctggctca ggcaattaaa gaggccaaag 258 0 

agcagcaccc tgacatgtca gtgaccaaag tagtggtcca taaagagaca gagatcacac 2640 

cagaagatgg agaggattga ccagaggaat aacttagctt gcacatgaat gcagtcatgc 2700 

aaaccgttag gaaaaccaga gcctatatgg agttccctct tctaacccaa ctgtacttgt 2760 

atctgtccgt ggaaaatttc agtccagaag aattgacctt gaccattaat aaagacactg 282 0 

gcagagagat cttcccataa taaagcaatc tgattcagca tcactaaacc gataatgcat 2880 
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gaagcaacga taaaattaca aaagagcagc atttttaatt ttcacaaaat gtctcagttt 294 0 

tcagctatac ctgctcgttc ataaccaaca atataaaccg tggtctcatg taacacataa 3 0 00 

acaattcatg cctttcatag tttattatta ttaaagtcta aacaaaattg caatttctta 3 060 

ggtaacctta tatttacaat aaatgaagat taccctcaaa tgctagaagc tgtctaggtc 312 0 

cgtccggtgt gtcagatttc ctcagattag atgtgccaat aaccaagttt attcagtaaa 318 0 

caacttgtac ttgtttcatc tggtttatta ctctcaccca taaacagtaa tgactctctg 324 0 

accctctgga aatatgtaat gcttccaatc ttgctttgtg tatctcattt aatttgttcc 3 3 00 

ggttaagga 33Q9 

<210> 35 

<211> 1195 

<212> DNA 

<213> Homo sapiens 

<400> 35 

ggcacgaggc gccagtcccc taaccctgag gctgccgcgc ggcggtcact gcgccggggt 60 

agtgggcccc agtgttgcgc tctctggccg ttccttacac tttgcttcag gctccagtgc 12 0 

aggggcgtag tgggatatgg ccaactcggg ctgcaaggac gtcacgggtc cagatgagga 18 0 

gagttttctg tactttgcct acggcagcaa cctgctgaca gagaggatcc acctccgaaa 240 

cccctcggcg gcgttcttct gtgtggcccg cctgcaggat tttaagcttg actttggcaa 3 00 

ttcccaaggc aaaacaagtc aaacttggca tggagggata gccaccattt ttcagagtcc 3 60 

tggcgatgaa gtgtggggag tagtatggaa aatgaacaaa agcaatttaa attctctgga 42 0 

tgagcaagaa ggggttaaaa gtggaatgta tgttgtaata gaagttaaag ttgcaactca 4 80 

agaaggaaaa gaaataacct gtcgaagtta tctgatgaca aattacgaaa gtgctccccc 54 0 

atccccacag tataaaaaga ttatttgcat gggtgcaaaa gaaaatggtt tgccgctgga 600 

gtatcaagag aagttaaaag caatagaacc aaatgactat acaggaaagg tctcagaaga 660 

aattgaagac atcatcaaaa agggggaaac acaaactctt tagaacataa cagaatatat 72 0 

ctaagggtat tctatgtgct aatataaaat atttttaaca cttgagaaca gggatctggg 780 

ggatctccac gtfctgatccg ttttcagcag tgctctgaag gagtatctta cttgggtgat 84 0 

tccttgtttt tagactataa aaagaaactg ggataggagt tagacaattt aaaaggggtg 9 00 

tatgagggcc tgaaatatgt gacaaatgaa tgtgagtacc ccttctgtga acactgaaag 960 

ctattctctt gaattgatct taagtgtctc cttgctctgg ' taaaagatag atttgtagct 1020 

cacttgatga tggtgctggt gaattgctct gctctgtctg agatttttaa aaatcagcfct 108 0 

aatgagagta atctgcagac aattgataat aacattttga aaattggaaa gatggtatac 1140 
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tgtttttaga ggaataaacg tatttgtggt ttaaaaaaaa aaaaaaaaaa aaaaa 1195 

<210> 36 

<211> 2035 

<212> DNA 

<213> Homo sapiens 

<400> 36 



gaattccggg ctccggggat gaggtcgcgg ccggcgggtc ccgcgctgtt 


gctgctgctg 




ctcttcctcg gagcggccga gtcggtgcgt cgggcccagc ctccgcgccg 


ctacacccca 


ion 


gactggccga gcctggattc tcggccgctg ccggcctggt tcgacgaagc 


caagttcggg 




gtgttcatcc actggggcgt gttctcggtg cccgcctggg gcagcgagtg 


gttctggtgg 




cactggcagg gcgaggggcg gccgcagtac cagcgcttca tgcgcgacaa 


ctacccgccc 




ggcttcagct acgccgactt cggaccgcag ttcactgcgc gcttcttcca 


cccggaggag 


O O V 


tgggccgacc tcttccaggc cgcgggcgcc aagtatgtag ttttgacgac 


aaagcatcac 


Aon 


gaaggcttca caaactggcc gagtcctgtg tcttggaact ggaactccaa agacgtgggg 


a on 
4oU 


cctcatcggg atttggttgg tgaattggga acagctctcc ggaagaggaa 


catccgctat 


c a n 


ggactatacc actcactctt agagtggttc catccactct atctacttga 


taagaaaaat 


o UU, 


ggcttcaaaa cacagcattt tgtcagtgca aaaacaatgc cagagctgta cgaccttgtt .. 


g~ tr r\ 
D O U 


aacagctata aacctgatct gatctggtct gatggggagt gggaatgtcc 


tgatacttac 




tggaactcca caaattttct fctcatggctc tacaatgaca gccctgtcaa 


ggatgaggtg , 


•7 q n 


gtagtaaatg accgatgggg tcagaactct tcctgtcacc atggaggata 


ctataactgt 


Q A A 


gaagataaat tcaagccaca gagcttgcca gatcacaagt gggagatgtg 


caccagcatt 


£> i"i A 


gacaagtttt cctggggcta tcgtcgtgac atggcattgt ctgatgttac 


agaagaatct 


you 


gaaatcattt cggaactggt tcagacagta agtttgggag gcaactatct 


tctgaacatt 




ggaccaacta aagatggact gattgttccc atcttccaag aaaggcttct 


tgctgttggg 


1080 


aaatggctga gcatcaatgg ggaggctatc tatgcctcca aaccatggcg ggtgcaatgg 


1140 


gaaaagaaca caacatctgt atggtatacc tcaaagggat cggctgttta 


tgccattttt 


1200 


ctgcactggc cagaaaatgg agtcttaaac cttgaatccc ccataactac 


cfccaactaca 


1260 


aagataacaa tgctgggaat tcaaggagat ctgaagtggt ccacagatcc 


agataaaggt 


1320 


ctcttcatct ctctacccca gttgccaccc tctgctgtcc ccgcagagtt 


tgcttggact 


1380 


ataaagctga caggagtgaa gtaatcattt gagtgcaaga agaaagaggc gctgctcact 


1440 


gttttcctgc ttcagttttt ctcttatagt accatcacta taatcaacga 


acttctcttc 


1500 


tccacccaga gatggctfctt ccaacacatt ttaattaaag gaactgagta 


cattaccctg 


1560 
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atgtctaaat 


ggaccaaaga tctgagatcc attgtgatta tatctgtatc aggtcagcag 


1620 


aagaaggaac ^tgagcagttg" aactctgagt tcatcaattc taatatttgg aaattatcta 


1680 


caatggaatc 


ttccctctgt tctctgataa cctacttgct tactcaatgc ctttaagcca 


1740 


agtcaccctg ttgcctatgg gaggaggtgg aaggatttgg caagctcaac cacatgctat 


1800 


ttagttagca 


tcagttgtca ccaacagtct ttctgcaaag ggcaggagag ctttggggga 


1860 


aaggaaaagg 


cttaccaggc tgctatggtc aactcttcag aaattttcag agcaatctaa 


1920 


aagcgccaaa attcgctatg tttacagtga tactattaag aaaatgaatg tgattctgct 


1980 


ctgtcttttt 


aagtatgatc aaataaaaaa tttgtacatc acaatcattt ctacc 


2035 


<210> 37 

<211> 2133 

<212> DNA 

<213> Homo sapiens 




<400> 37 
cgggagagcg 


cgctctgcct gccgcctgcc tgcctgccac tgagggttcc cagcaccatg . 


60 


agggcctgga 


tcttctttct cctttgcctg gccgggaggg ccttggcagc ccctcagcaa 


120 


gaagccctgc 


ctgatgagac agaggtggtg gaagaaactg tggcagaggt gactgaggta 


180 


tctgtgggag 


ctaatcctgt ccaggtggaa gtaggagaat ttgatgatgg tgcagaggaa 


240 


accgaagagg 


aggtggtggc ggaaaatccc tgccagaacc accactgcaa acacggcaag 


300 


gtgtgcgagc 


tggatgagaa caacaccccc atgtgcgtgt gccaggaccc caccagctgc 


360 


ccagccccca 


ttggcgagtt tgagaaggtg tgcagcaatg acaacaagac cttcgactct 


420 


tcctgccact 


tctttgccac aaagtgcacc ctggagggca ccaagaaggg ccacaagctc 


480 


cacctggact 


acatcgggcc ttgcaaatac atcccccctt gcctggactc tgagctgacc 


540 


gaattccccc 


tgcgcatgcg ggactggctc aagaacgtcc tggtcaccct gtatgagagg 


600 


gatgaggaca 


acaaccttct gactgagaag cagaagctgc gggtgaagaa gatccatgag 


660 


aatgagaagc 


gcctggaggc aggagaccac cccgtggagc tgctggcccg ggacttcgag 


720 


aagaactata 


acatgtacat cttccctgta cactggcagt tcggccagct ggaccagcac 


780 


cccattgacg 


ggtacctctc ccacaccgag ctggctccac tgcgtgctcc cctcatcccc 


840 


atggagcatt 


gcaccacccg ctttttcgag acctgtgacc tggacaatga caagtacatc 


900 


gccctggatg 


agtgggccgg ctgcttcggc atcaagcaga aggatatcga caaggatctt 


960 


gtgatctaaa 


tccactcctt ccacagtacc ggattctctc tttaaccctc cccttcgtgt 


1020 


ttcccccaat 


gtttaaaatg tttggatggt ttgttgttct gcctggagac aaggtgctaa 


1080 


catagattta 


agtgaataca ttaacggtgc taaaaatgaa aattctaacc caagacatga 


1140 



lei uepui 
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cattcttagc 


tgtaacttaa ctattaaggc 


cttttccaca 


cgcattaata gtcccatttt 


1200 


tctcttgcca tttgtagctt tgcccattgt 


cttattggca 


catgggtgga 


cacggatctg 


1260 


ctgggctctg 


ccttaaacac acattgcagc 


ttcaactttt 


ctctttagtg 


ttctgtttga 


1320 


aactaatact 


taccgagtca gactttgtgt 


tcatttcatt 


tcagggtctt 


ggctgcctgt 


1380 


gggcttcccc 


aggtggcctg gaggtgggca 


aagggaagta 


acagacacac 


gatgttgtca 


1440 


aggatggttt 


tgggactaga ggctcagtgg tgggagagat 


ccctgcagaa 


tccaccaacc 


1500 


agaacgtggt 


ttgcctgagg ctgtaactga gagaaagatt 


ctggggctgt 


cttatgaaaa 


1560 


tatagacatt 


ctcacataag cccagttcat 


caccatttcc 


tcctttacct 


ttcagtgcag 


1620 


tttcttttca cattaggctg ttggttcaaa 


cttttgggag 


cacggactgt 


cagttctctg 


1680 


ggaagtggtc 


agcgcatcct gcagggcttc 


tcctcctctg 


tcttttggag 


aaccagggct 


1740 


cttctcaggg 


gctctaggga ctgccaggct 


gtttcagcca 


ggaaggccaa 


aatcaagagt 


1800 


gagatgtaga 


aagttgtaaa atagaaaaag 


tggagttggt 


gaatcggttg ttctttcctc 


1860 


acatttggat 


gattgtcata aggtttttag catgttcctc 


cttttcttca 


ccctcccctt 


1920 


tgttcttcta 


ttaatcaaga gaaacttcaa 


agttaatggg 


atggtcggat 


ctcacaggct 


1980 


gagaactcgt 


tcacctccaa gcatttcatg 


aaaaagctgc 


ttcfctatfcaa 


tcatacaaac. 


2040 


tctcaccatg 


atgtgaagag tttcacaaat 


ctttcaaaat 


aaaaagtaat 


gacttagaaa . 


2100 


ctgaaaaaaa 


aaaaaaaaaa aaaaaaaaaa 


aaa 
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<211> 20 
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<400> 38 

agggaggaag ggaaaacaga 2 0 

<210> 39 

<211> 20 

<212> DNA 
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<400> 39 

ttaaggctca acacgaggct 20 

<210> 40 
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cttgagctgt gaggtcatcg 
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<400> 41 

tatagctcgg caccttcacc 
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<211> 21 

<212> DNA 

<213> Homo sapiens 

<400> 42 

ctgcctgcca ctgagggttc c 

<210> 43 

<211> 24 

<212> DNA 

<213> Homo sapiens 
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<210> 46 
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<212> DNA 

<213> Homo sapiens 
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tgttggcgta caggtctttg c 

<210> 47 

<211> 19 

<212> DNA 

<213> Homo sapiens 



<400> 47 

gctacgagct gcctgacgg 
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